
이번 주에 Google은 효율적인 성능으로 칭찬받은 Gemma 3라는 오픈 AI 모델 패밀리를 공개했습니다. 그러나 X에서 몇몇 개발자들이 비상업용으로 모델을 사용하는 것이 위험할 수 있다고 한 것에 대해 한숨을 내쉬었습니다.
Gemma 3에만 해당되는 문제는 아닙니다. Meta와 같은 기업들도 자사의 오픈되게 제공하는 모델에 사용자 정의, 비표준 라이선싱 조항을 적용하고 있으며, 이러한 조항은 기업들에게 법적 도전을 제기합니다. 특히 규모가 작은 기업들은 Google과 기타 기업들이 보다 무거운 조항을 강조함으로써 자신들의 비즈니스에 빗장을 치는 것을 우려합니다.
오픈 모델 개발자들은 Apache나 MIT와 같은 산업 표준 옵션 대신에 소유권 라이선스 아래 모델을 공개하는 이유가 있습니다. 예를 들어, AI 스타트업 Cohere는 모델 위에 공학적 일을 지원하겠지만 상업적 용도는 지원하지 않겠다는 의도를 분명히 했습니다.
하지만 Gemma와 Meta의 Llama 라이선스는 특히 Llama 3 모델의 사용 방법을 법적 보복을 두려워하지 않고 제한합니다.
예를 들어 Meta는 Llama 3 모델의 '출력 또는 결과'를 Llama 3 또는 '파생물 작품' 외에 다른 모델을 개선하기 위해 사용하는 것을 금지합니다. 또한, 매월 활성 사용자가 7억 명 이상인 회사는 특별 추가 라이선스를 먼저 획득하지 않고는 Llama 모델을 배포할 수 없습니다.
Gemma의 라이선스는 일반적으로 덜 부담스럽습니다. 그러나 구글은 Gemma의 사용이 회사의 금지된 사용 정책이나 '해당 법률과 규정'을 위반한다고 판단된다고 믿을 경우 Gemma의 사용을 '제한 (원격 또는 그 외)'할 권리를 부여합니다.
이러한 조항은 원래의 Llama와 Gemma 모델에만 적용되는 것이 아닙니다. Llama나 Gemma에 기반을 둔 모델은 각각 Llama와 Gemma 라이선스를 준수해야 합니다. Gemma의 경우, Gemma가 생성한 합성 데이터로 훈련된 모델도 이에 해당됩니다.
인공 지능 연구원인 Florian Brand는 기술 업계 거물 임원들이 이야기하듯이 Gemma와 Llama와 같은 라이선스는 합리적으로 '오픈 소스'라고 불릴 수 없다고 생각합니다.
'대부분의 기업들은 Apache 2.0과 같은 승인된 라이선스 세트를 갖고 있기 때문에 사용자 정의 라이선스는 많은 문제와 비용을 야기합니다.' Brand는 TechCrunch에 말했습니다. '법률 팀이나 변호사를 고용하거나 비용을 들일 수 없는 작은 기업들은 표준 라이선스가 있는 모델을 사용할 것입니다.'
Google과 같은 사용자 지정 라이선스를 가진 AI 모델 개발자들은 아직까지 그 조항을 강력하게 시행하지 않았다고 Brand는 말했습니다. 그러나 이러한 협박이 채택을 방해하는 데 충분하다고 그는 덧붙였습니다.
'이러한 제한은 AI 생태계에 영향을 미칩니다 - 저와 같은 AI 연구자들에게도요.' Brand는 말했습니다.
Moody's의 머신 러닝 담당 이한정 Lee는 Gemma와 Llama와 같은 사용자 정의 라이선스가 '많은 상업적 시나리오에서 사용할 수 없게' 한다고 말합니다. AI 스타트업 Gretel의 스탭 응용 과학자인 Eric Tramel도 동의합니다.
'모델별 라이선스는 모델 파생물 및 증류에 대한 특정 제한을 설정하므로 꺼내기에 대한 우려가 있습니다.' Tramel은 말했습니다. '예를 들어, 특정 고객을 위해 모델 파인튜닝을 특정 비즈니스를 진행하고 있는 회사를 상정해보십시오. Llama 데이터로 파인튜닐된 Gemma 데이터에는 어떤 라이선스가 필요합니까? 그것이 모든 그들의 하류 고객에게 미칠 영향은 무엇인가요?'.
데플로이어들이 가장 두려워하는 시나리오는 모델이 일종의 트로이 목마이라는 것입니다.
'모델 공장은 [오픈] 모델을 출시하고, 그 모델을 사용하여 개발되는 비즈니스 케이스가 어떻게 발전하는지 지켜보고, 그 성공적인 수직 분야로 이르게 하기 위해 협박이나 법률 싸움을 벌일 수 있습니다.' 그는 말했습니다. '예를 들어, 외관상으로 Gemma 3은 강력한 릴리스 같습니다 - 그리고 광범위한 영향을 미칠 수 있는 것 같습니다. 그러나 시장이 라이선스 구조 때문에 채택할 수 없습니다. 그래서 비즈니스들은 아마도 더 약하고 신뢰할 수 없는 Apache 2.0 모델로 머물러 있을 것입니다.'
분명히, 일부 모델은 제한적인 라이선스에도 불구하고 널리 배포되었습니다. 예를 들어, Llama는 수백만 회 다운로드되고 Spotify를 포함한 주요 기업의 제품에 내장되었습니다.
그러나 Yacine Jernite, AI 스타트업 Hugging Face의 머신 러닝 및 사회 담당자는 그들이 허락 된 라이선스로 발행될 경우 더 성공할 수 있다고 말합니다. Jernite는 Google과 같은 제공업체들이 오픈 라이선스 프레임워크로 이동하고 사용자들과 광범위하게 승인된 조건에 대해 '더 직접적으로 협력'하도록 촉구했습니다.
'이러한 조항에 대한 합의가 없으며, 많은 기본 가정이 아직 법원에서 시험되지 않았기 때문에 모든 것이 주로 해당 주체의 의도 선언으로 이어진다.' Jernite는 말했습니다. '그러나 특정 절문들이 너무 넓게 해석된다면, 많은 좋은 일들이 불확실한 법적 토대에 자리할 것이며, 특히 성공적인 상업 제품을 개발 중인 조직에게는 매우 불안한 상황이 될 것입니다.'
Vidal은 자유롭게 통합하고 수정하고 공유할 수있는 AI 모델 회사들에 대한 절박한 필요성이 있다고 말했습니다. '현재의 AI 모델 라이선스 환경은 혼란, 제한적인 조항, 그리고 오픈이라는 잘못된 주장으로 가득합니다.' Vidal은 말했습니다. '기업 이익에 맞추어 '오픈'을 재정의하는 대신, AI 산업은 공식적인 오픈 소스 원칙에 맞추어 진정으로 오픈된 생태계를 만들어야 합니다.'