[번역] 코인베이스 리포트: 크립토의 AI 신기루
핵심 요약
- 인공지능(AI)과 암호화폐의 교차점은 매우 광범위하며 종종 제대로 이해되지 않는 경우가 많습니다. 저희는 이 교차점의 여러 하위 분야마다 기회와 개발 일정이 크게 다르다고 생각합니다.
- 일반적으로 탈중앙화만으로는 AI 제품의 경쟁력이 충분하지 않으며, 다른 주요 영역에서도 중앙화된 제품과 기능적으로 동등한 수준에 도달해야 한다고 생각합니다.
- 저희의 반대 견해는 많은 AI 토큰의 가치 잠재력이 AI 산업에 대한 광범위한 관심의 결과로 과장되었을 수 있으며, 많은 AI 토큰이 단기 및 중기적으로 지속 가능한 수요 측면의 동인이 부족할 수 있다는 것입니다.
최근 몇 년간 AI, 특히 생성형 AI의 지속적인 발전으로 인해 AI 산업에 대한 관심이 높아졌으며, 두 산업의 교차점에 위치한 암호화폐 프로젝트에도 기회가 찾아왔습니다.
앞서 2023년 6월의 이전 보고서에서 암호화폐의 전반적인 자본 배분이 AI에 비해 과소평가된 것으로 보인다는 점을 지적하며 업계의 몇 가지 가능성에 대해 다룬 바 있습니다.
이후 암호화폐-AI 분야는 엄청나게 성장했으며, 광범위한 채택을 가로막을 수 있는 몇 가지 실질적인 과제를 강조하는 것이 중요하다고 생각합니다.
AI의 급격한 변화는 암호화폐 중심 플랫폼이 업계를 혼란에 빠뜨릴 수 있는 독보적인 위치에 있다는 과감한 주장을 경계하게 만들며, 특히 고정 토큰 이코노미 모델의 경우 대부분의 AI 토큰에 장기적이고 지속 가능한 가치를 창출할 수 있는 길을 불확실하게 만들고 있다고 저희는 생각합니다.
오히려 AI 분야의 새로운 트렌드 중 일부는 광범위한 시장 경쟁과 규제를 고려할 때 암호화폐 기반 혁신이 채택되는 것을 더 어렵게 만들 수 있다고 생각합니다.
하지만 저희는 AI와 암호화폐의 교차점이 광범위하고 다양한 기회를 가지고 있다고 생각합니다. 특정 하위 분야는 더 빠른 속도로 채택될 수 있지만, 이러한 분야에는 거래 가능한 토큰이 부족한 경우가 많습니다. 그럼에도 불구하고 이것이 투자자들의 투자 욕구를 저해하지는 않는 것으로 보입니다.
AI 관련 암호화폐 토큰의 성과는 AI 시장 헤드라인에 의해 뒷받침되며, 비트코인이 하락하는 날에도 긍정적인 가격 움직임을 뒷받침할 수 있다는 사실을 발견했습니다. 따라서 많은 AI 관련 토큰이 AI 발전에 대한 보다 일반적인 프록시로 계속 거래될 수 있다고 생각합니다.
AI의 주요 트렌드
저희는 AI 분야에서 가장 중요한 트렌드 중 하나(암호화 AI 제품과 관련)는 오픈 소스 모델에 대한 지속적인 문화라고 생각합니다. 연구자와 사용자가 작동하고 미세 조정할 수 있도록 53만 개 이상의 모델이 허깅 페이스(AI 커뮤니티의 협업 플랫폼)에서 공개적으로 사용 가능합니다.
AI 협업에서 허깅 페이스의 역할은 코드 호스팅을 위해 깃허브나 커뮤니티 관리를 위해 디스코드에 의존하는 것과 다르지 않습니다. (둘 다 크립토에서 널리 사용됨) 심각한 관리상의 문제가 발생하지 않는 한 가까운 장래에 이러한 방식이 바뀔 것 같지는 않습니다.
허깅 페이스에서 사용할 수 있는 모델은 대규모 언어 모델(LLMs)부터 생성 이미지 및 동영상 모델에 이르기까지 다양하며 오픈AI, 메타, 구글과 같은 업계 주요 업체에서 개인 개발자가 만든 모델까지 포함되어 있습니다.
일부 오픈 소스 언어 모델은 처리량에서 최첨단 폐쇄형 소스 모델에 비해 성능 우위를 점하고 있으며 (비슷한 출력 품질을 유지하면서도), 오픈 소스와 상용 모델 간에 일정 수준의 경쟁이 이루어지고 있습니다. (그림 1 참조)
중요한 점은 우리가 이 활기찬 오픈 소스 생태계와 경쟁적인 상용 부문을 결합하여. 성능이 낮은 모델이 경쟁에서 사라지게 만들고 있다고 생각합니다.
두 번째 트렌드는 소규모 모델의 품질과 비용 효율성이 향상되고 있다는 점입니다.(2020년 초 LLM 연구와 최근 마이크로소프트의 논문에서 강조됨) 이는 오픈 소스 문화와 맞물려 향후 로컬에서 실행되는 고성능 AI 모델의 미래를 더욱 가능하게 할 것입니다.
일부 미세 조정된 오픈 소스 모델은 특정 벤치마크에서 선도적인 폐쇄형 소스 모델을 능가할 수도 있습니다. 이러한 세상에서 일부 AI 모델은 로컬에서 실행될 수 있으므로 최대한 탈중앙화될 수 있습니다. 물론 기존 기술 기업들은 계속해서 클라우드에서 더 큰 규모의 모델을 학습하고 실행할 것이지만, 둘 사이의 설계 공간에는 상충되는 부분이 있을 것입니다.
이와는 별도로, 데이터 오염과 다양한 테스트 범위 등 점점 더 복잡해지는 AI 모델 벤치마킹 작업을 고려할 때, 생성 모델 결과물은 궁극적으로 자유 시장에서 최종 사용자가 가장 잘 평가할 수 있다고 생각합니다.
실제로 최종 사용자가 모델 결과물을 나란히 비교할 수 있는 기존 도구와 동일한 작업을 수행하는 회사를 벤치마킹할 수 있는 도구가 있습니다. 상식 추론, 학술 주제, 다양한 질문 형식 등 각기 다른 사용 사례를 테스트하는 MMLU, HellaSwag, TriviaQA, BoolQ 등 지속적으로 성장하고 있는 다양한 오픈 LLM 벤치마크를 보면 생성 AI 벤치마킹의 어려움에 대한 피상적인 이해를 할 수 있습니다.
AI 분야에서 관찰되는 세 번째 트렌드는 사용자 종속성이 강하거나 구체적인 비즈니스 문제가 있는 기존 플랫폼이 AI 통합을 통해 불균형적인 이점을 얻을 수 있다는 점입니다.
코드 편집기와의 통합으로 이미 강력한 개발자 환경이 강화된 깃헙 코파일럿을 예로 들 수 있습니다. 메일 클라이언트에서 스프레드시트, 고객 관계 관리 소프트웨어에 이르는 다른 도구에 AI 인터페이스를 임베드하는 것도 AI의 자연스러운 사용 사례입니다. (예: 700명의 정규직 상담원 업무를 수행하는 Klarna의 AI 어시스턴트)
그러나 이러한 많은 시나리오에서 AI 모델은 새로운 플랫폼으로 이어지지 않고 기존 플랫폼을 보강하는 데 그친다는 점에 유의해야 합니다. 내부적으로 기존 비즈니스 프로세스를 개선하는 다른 AI 모델(예: Apple의 앱 트래킹 투명성 출시 이후 광고 실적을 회복한 Meta의 Lattice)도 독점 데이터와 폐쇄형 시스템에 의존하는 경우가 많습니다.
이러한 유형의 AI 모델은 핵심 제품 오퍼링에 수직적으로 통합되고 독점 데이터를 사용하기 때문에 비공개 소스로 유지될 가능성이 높습니다.
AI 하드웨어 및 컴퓨팅 분야에서는 두 가지 관련 트렌드를 추가로 확인할 수 있습니다. 첫 번째는 학습에서 추론으로 컴퓨팅 사용의 전환입니다. 즉, AI 모델을 처음 개발할 때는 대규모 데이터 세트를 공급하여 모델을 '학습'시키는 데 많은 컴퓨팅 리소스가 사용되었습니다. 그리고 이제는 모델을 배포하고 쿼리를 생성하는 쪽으로 전환되고 있습니다.
엔비디아의 2024년 2월 실적 발표에서는 비즈니스의 약 40%가 추론(Inference) 인프라라고 밝혔으며, 사타야 나델라는 한 달 전인 1월에 열린 마이크로소프트 실적 발표에서 애저 AI 사용의 "대부분"이 추론에 사용된다고 언급하며 비슷한 발언을 했습니다.
이러한 추세가 지속됨에 따라 모델을 수익화하려는 기업은 안전하고 프로덕션에 바로 사용할 수 있는 방식으로 모델을 안정적으로 실행할 수 있는 플랫폼을 우선적으로 고려할 것으로 예상됩니다.
두 번째 주요 트렌드는 하드웨어 아키텍처를 둘러싼 경쟁 환경입니다. 엔비디아의 H200 프로세서는 2Q24부터 출시될 예정이며, 다음 세대인 B100은 성능을 두 배로 향상시킬 것으로 예상됩니다. 또한, 구글이 자체 텐서 처리 장치 (TPUs)와 Groq의 최신 언어 처리 장치 (LPUs)에 대한 지속적인 지원을 통해 향후 몇 년 동안 이 분야의 대안으로 시장 점유율을 높일 수 있습니다. (그림 2 참조)
이러한 발전은 AI 산업의 비용 역학 관계를 변화시킬 수 있으며, 하드웨어를 대량으로 조달하며 관련 물리적 네트워킹 요구 사항 및 개발자 도구를 설정할 수 있는 클라우드 제공업체에 유리할 수 있습니다.
전반적으로 AI 분야는 초기 단계에 있으며 빠르게 성장하고 있는 분야입니다. ChatGPT가 시장에 처음 출시된 것은 불과 1.5년 전인 2022년 11월이었지만(기본 GPT-3 모델은 2020년 6월부터 존재했음에도 불구하고), 그 이후 이 분야의 빠른 발전은 놀랍기 그지없습니다.
물론 일부 생성 AI 모델의 편향성에 대한 의심스러운 점이 있었지만, 성능이 떨어지는 모델은 더 나은 대안을 위해 시장에서 무시되기 시작했습니다. 이 분야의 빠른 발전과 새로운 규제의 가능성은 새로운 솔루션이 시장에 출시됨에 따라 업계의 문제 영역이 정기적으로 변화하고 있음을 의미합니다.
"탈중앙화가 [문제 삽입] 문제를 해결한다"는 식의 성급한 결론을 내리는 것은 빠르게 혁신하는 이 분야에서 시기상조라고 생각합니다. 또한 존재하지 않을 수도 있는 중앙 집중화 문제를 선제적으로 해결하는 것이기도 합니다.
AI 산업은 이미 다양한 기업과 오픈소스 프로젝트 간의 경쟁을 통해 기술 및 비즈니스 분야에서 많은 탈중앙화가 이루어지고 있는 것이 현실입니다. 또한, 기술 및 사회적 수준에서 진정한 탈중앙화 프로토콜은 의사 결정과 합의 과정의 특성상 중앙화된 프로토콜보다 느리게 움직입니다.
이는 현재 AI 개발 단계에서 탈중앙화와 기능 경쟁력의 균형을 맞추려는 제품에 장애가 될 수 있습니다. 그렇지만, 저희는 암호화폐와 AI 사이에 특히 장기간에 걸쳐 의미 있게 실현될 수 있는 시너지 효과가 있다고 생각합니다.
기회 범위 찾기
크게 보면, 저희는 AI와 암호화폐의 교차점을 두 가지 일반적인 범주로 보고 있습니다.
첫 번째는 AI 제품이 암호화폐 산업을 개선하는 사용 사례입니다. 여기에는 사람이 읽을 수 있는 트랜잭션을 생성하고 블록체인 데이터 분석을 개선하는 것부터 비허가형 프로토콜의 일부로 온체인에서 모델 결과물을 활용하는 것까지 다양한 시리오가 포함됩니다.
두 번째 범주는 암호화폐가 컴퓨팅, 검증, 신원 확인 등을 위한 탈중앙화를 통해 기존의 AI 파이프라인을 파괴하는 것을 목표로 하는 사용 사례입니다.
전자의 비즈니스 연계 시나리오에 대한 사용 사례는 저희의 관점에서는 분명하며, 상당한 기술적 과제가 남아 있지만 온체인에서 모델을 추론하는 더 복잡한 시나리오에도 장기적인 가능성이 있다고 믿습니다. 중앙화된 AI 모델은 개발자 도구와 코드 감사 개선부터 인간의 언어를 온체인 액티노로 전환하는 것까지, 다른 기술 중심 산업과 마찬가지로 암호화폐를 크게 개선할 수 있습니다. 그러나 이 분야에 대한 투자는 일반적으로 벤처 펀딩을 통해 민간 기업에 이루어지며, 그 결과 일반적으로 공개 시장에서는 간과되고 있습니다.
그러나 우리가 덜 확신하는 것은 두 번째 범주의 가치 제안(즉, 암호화폐가 기존 AI 파이프라인을 파괴하는 수단)입니다.
후자의 과제는 기술적 과제(일반적으로 장기적으로 해결할 수 있다고 생각되는)보다 우선하며, 광범위한 시장 및 규제 기관과의 힘겨운 싸움입니다. 그렇지만 최근 AI와 암호화폐에 대한 많은 관심이 이 범주에 집중되고 있는 것은 이러한 사용 사례가 유동 토큰에 더 적합하기 때문입니다.
현재로서는 암호화폐의 중앙화된 AI 툴링과 관련된 유동성 토큰이 상대적으로 적기 때문에 다음 섹션에서는 이 부분에 초점을 맞추고자 합니다.
AI 파이프라인에서 암호화폐의 역할
지나치게 단순화할 위험은 있지만, 저희는 AI 파이프라인의 네 가지 단계, 즉 (1) 데이터 수집, 저장, 엔지니어링, (2) 모델 학습 및 추론, (3) 모델 결과의 검증, (4) AI 모델의 결과물 추적에 걸쳐 암호화폐가 AI에 미칠 잠재적 영향을 살펴보고 있습니다.
이러한 분야 전반에 걸쳐 새로운 암호화 AI 프로젝트가 많이 생겨나고 있지만, 많은 프로젝트가 단기 및 중기적으로 수요 창출과 중앙화된 기업 및 오픈 소스 솔루션과의 치열한 경쟁에서 중요한 도전에 직면할 것으로 예상됩니다.
독점 데이터
데이터는 모든 AI 모델의 기초이며, 특화된 AI 모델 성능의 핵심 차별화 요소입니다. 과거 블록체인 데이터 자체는 모델을 위한 새롭고 풍부한 데이터 소스이며, Grass와 같은 특정 프로젝트는 암호화폐 인센티브를 활용하여 오픈 인터넷에서 새로운 데이터 세트를 큐레이션하는 것을 목표로 합니다. 이와 관련하여 암호화폐는 산업별 데이터 세트를 제공할 뿐만 아니라 새로운 가치 있는 데이터 세트의 생성을 장려할 수 있는 기회를 제공합니다. (최근 레딧이 구글과 체결한 연간 6천만 달러 규모의 데이터 라이선스 계약은 데이터 세트의 수익 창출이 증가할 미래를 예고)
GPT-3와 같은 초기 모델에서는 CommonCrawl, WebText2, 책, Wikipedia와 같은 개방형 데이터 세트와 허깅 페이스에서 무료로 제공되는 유사한 데이터 세트(현재 110,000개 이상의 옵션 호스팅)를 혼합하여 사용했습니다.
그러나 최근의 많은 비공개 소스 모델들은 상업적 이익을 보호하기 위해 최종 학습 데이터 세트 구성을 공개하지 않고 있습니다. 특히 상용 모델에서 독점 데이터세트를 선호하는 추세는 계속될 것이며 데이터 라이선싱의 중요성이 더욱 커질 것으로 예상됩니다.
기존의 중앙 집중식 데이터 마켓플레이스는 이미 데이터 공급자와 소비자 간의 격차를 해소하는 데 도움을 주고 있으며, 이는 오픈 소스 데이터 디렉토리와 기업 경쟁사 사이에 새로운 분산형 데이터 마켓플레이스 솔루션의 기회 공간을 끼워넣고 있다고 생각합니다.
법적 구조의 뒷받침이 없는 순수 탈중앙화 데이터 마켓플레이스는 표준화된 데이터 인터페이스와 파이프라인을 구축하고, 데이터 무결성과 프로비저닝을 검증하며, 제품의 콜드 스타트 문제를 해결하는 동시에 시장 참여자 간의 토큰 인센티브 균형을 맞춰야 합니다.
이와는 별도로, 탈중앙화된 스토리지 솔루션도 결국 AI 산업에서 틈새 시장을 찾을 수 있겠지만, 그 측면에서도 여전히 의미 있는 과제가 남아 있다고 생각합니다. 한편으로는 오픈 소스 데이터세트를 배포하기 위한 파이프라인이 이미 존재하며 널리 사용되고 있습니다. 반면에 많은 독점 데이터 세트의 소유자는 엄격한 보안 및 규정 준수 요구 사항을 가지고 있습니다.
현재 Filecoin이나 Arweave와 같은 분산형 스토리지 플랫폼에서 민감한 데이터를 호스팅할 수 있는 규제 경로는 존재하지 않습니다. 실제로 많은 기업이 여전히 온프레미스 서버에서 중앙 집중식 클라우드 스토리지 제공업체로 전환하고 있습니다. 기술적인 측면에서 이러한 네트워크의 탈중앙화 특성은 현재 민감한 데이터 저장에 대한 특정 지리적 위치 및 물리적 데이터 사일로 요건과도 호환되지 않습니다.
탈중앙화 스토리지 솔루션과 성숙한 클라우드 제공업체 간의 가격 비교를 통해 탈중앙화가 스토리지 단위당 더 저렴하다는 주장도 있지만, 이는 더 큰 그림을 놓치고 있다고 생각합니다.
첫째, 제공업체 간 시스템 마이그레이션과 관련된 초기 비용은 일상적인 운영 비용 외에 고려해야 할 사항이 있습니다.
둘째, 암호화폐 기반의 탈중앙화 스토리지 플랫폼은 지난 20년 동안 발전해온 성숙한 클라우드 시스템의 더 나은 도구와 통합에 부합해야 합니다. 비즈니스 운영 관점에서 클라우드 솔루션은 비용 예측이 가능하고, 계약 의무와 전담 지원팀을 제공하며, 기존 개발자 인재 풀도 풍부합니다.
또한 "빅 3" 클라우드 제공업체(Amazon Web Services, Google Cloud Platform, Microsoft Azure)만을 피상적으로 비교하는 것은 불완전하다는 점도 주목할 필요가 있습니다. 더 저렴한 베어본 서버 랙을 제공하는 수십 개의 저가 클라우드 업체도 시장 점유율을 확보하기 위해 경쟁하고 있습니다.
저희는 이러한 업체들이 비용에 민감한 소비자를 위한 단기적인 주요 경쟁자라고 생각합니다. 하지만 Filecoin의 데이터에 대한 컴퓨팅과 Arweave의 AO 컴퓨팅 환경과 같은 최근의 혁신은 덜 민감한 데이터 세트를 활용하는 향후 그린필드 프로젝트나 비용에 가장 민감한 (아직 벤더에 종속되지 않은) 소규모 기업에게 중요한 역할을 할 수 있을 것입니다.
따라서 데이터 분야에서 새로운 암호화폐 지원 제품이 등장할 여지는 분명 존재하지만, 가장 가까운 시기의 파괴적 혁신은 고유한 가치 제안을 창출할 수 있는 곳에서 일어날 것으로 예상됩니다. 탈중앙화 제품이 기존 및 오픈 소스 경쟁업체와 정면으로 경쟁하는 분야는 발전하는 데 훨씬 더 많은 시간이 걸릴 것으로 예상됩니다.
학습 및 추론 모델
암호화폐의 탈중앙화 컴퓨팅(DeComp) 분야는 부분적으로는 기존의 GPU 공급 부족으로 인해 중앙화된 클라우드 컴퓨팅의 대안이 되는 것을 목표로 하고 있습니다. 아카시나 렌더와 같은 프로토콜이 수용한 이러한 공급 부족에 대한 한 가지 해결책은 집단 네트워크에서 유휴 컴퓨팅 자원을 중앙화된 클라우드 제공자에게 저렴한 비용으로 재사용하는 것입니다.
예비 지표에 따르면, 이러한 프로젝트는 사용자와 공급자 양측 모두에서 사용량이 증가하고 있는 것으로 보입니다. 예를 들어, 아카시는 현재까지 활성 임대(즉, 사용자 수)가 3배 증가했으며, (그림 3 참조) 이는 주로 스토리지와 컴퓨팅 리소스 사용 증가에 힘입은 바가 큽니다.
그러나 사용 가능한 GPU의 공급이 해당 리소스에 대한 수요 증가를 앞지르면서 네트워크에 지불하는 수수료는 2023년 12월 정점을 찍은 이후 실제로 감소했습니다. 즉, 더 많은 공급자가 네트워크에 참여함에 따라 (비례적으로 가장 큰 수익을 창출하는 것으로 보이는) 임대되는 GPU의 수가 감소했습니다. (그림 4 참조)
수요와 공급의 변동에 따라 컴퓨팅 가격이 달라질 수 있는 네트워크의 경우, 공급 측면의 성장이 수요 측면의 성장을 앞설 경우 네이티브 토큰에 대한 지속적인 사용량 중심의 수요가 궁극적으로 어디서 발생할지는 불분명합니다.
이러한 변화의 장기적인 영향은 현재로서는 알 수 없지만, 향후 시장 변화에 최적화하기 위해 이러한 토큰 이코노미 모델을 재검토해야 할 가능성이 높다고 생각합니다.
기술적인 측면에서 보면, 분산형 컴퓨팅 솔루션은 네트워크 대역폭 제한이라는 문제도 안고 있습니다. 멀티 노드 트레이닝이 필요한 대규모 모델의 경우 물리적 네트워크 인프라 계층이 중요한 역할을 합니다.
데이터 전송 속도, 동기화 오버헤드, 특정 분산 훈련 알고리즘 지원은 고성능 실행을 위해 특정 네트워크 구성과 맞춤형 네트워킹 통신(예: InfiniBand)이 필요하다는 것을 의미합니다. 이는 특정 클러스터 규모를 넘어서는 분산된 방식으로는 달성하기 어렵습니다.
전반적으로 볼 때, 분산형 컴퓨팅(및 스토리지)의 장기적인 성공은 중앙 집중식 클라우드 제공업체와의 강력한 경쟁에 직면해 있다고 생각합니다.
저희의 견해로는 모든 도입은 최소한 클라우드 도입 일정과 비슷한 다년간의 과정이 될 것입니다. 탈중앙화 네트워크 개발의 기술적 복잡성이 증가하고 확장 가능한 개발 및 영업팀의 부재를 고려할 때 탈중앙화 컴퓨팅 비전을 완전히 실행하는 것은 힘든 여정이 될 것으로 예상됩니다.
모델 유효성 검사 및 신뢰
AI 모델이 우리 삶에서 점점 더 중심이 되면서, 그 결과물의 품질과 편향성에 대한 우려가 커지고 있습니다. 일부 암호화폐 프로젝트는 다양한 카테고리의 결과를 평가하기 위해 일련의 알고리즘을 활용하여 이 문제에 대한 탈중앙화된 시장 기반 솔루션을 찾는 것을 목표로 합니다.
그러나 앞서 언급한 모델 벤치마킹과 관련된 문제와 명백한 비용, 처리량, 품질 트레이드 오프는 직접 비교를 어렵게 만듭니다. 이 범주에서 가장 큰 AI 중심 암호화폐 중 하나인 비트텐서는 이 문제를 해결하고자 하지만, 광범위한 채택을 방해할 수 있는 여러 가지 기술적 과제가 남아 있습니다. (부록 1 참조)
이와는 별도로, 무신뢰 모델 추론(즉, 모델 결과가 실제로 주장된 모델에 의해 생성되었음을 증명하는 것)은 암호-AI 중복 영역에서 활발히 연구되고 있는 또 다른 영역입니다. 그러나 오픈 소스 모델의 규모가 축소됨에 따라 이러한 솔루션은 수요 측면에서 어려움에 직면할 수 있다고 생각합니다.
잘 확립된 파일 해시/체크섬 방법론을 통해 콘텐츠 무결성이 검증된 모델을 로컬에서 다운로드하고 실행할 수 있는 환경에서는 신뢰 없는 추론의 역할이 명확하지 않습니다.
물론 아직 많은 LLM이 휴대폰과 같은 경량 디바이스에서 학습되고 작동할 수 있는 것은 아니지만, 고사양 게임용 컴퓨터와 같은 강력한 데스크톱 컴퓨터는 이미 많은 고성능 모델을 실행하는 데 사용될 수 있습니다.
데이터 출처 및 신원 확인
생성형 AI의 결과물이 점점 더 인간의 것과 구별하기 어려워짐에 따라 AI가 생성한 콘텐츠를 추적하는 것의 중요성 또한 대두되고 있습니다. GPT-4는 GPT-3.5의 3배에 달하는 속도로 튜링 테스트를 통과했으며, 온라인 페르소나가 봇과 인간을 구분할 수 없는 날이 머지않아 다가올 것으로 보입니다.
이러한 세상에서는 온라인 사용자의 인간성을 파악하고 AI가 생성한 콘텐츠에 워터마킹을 하는 것이 매우 중요한 기능이 될 것입니다.
월드코인과 같은 탈중앙화된 식별자 및 신원 증명 메커니즘은 체인 상에서 인간을 식별하는 전자의 문제를 해결하고자 합니다. 마찬가지로, 데이터 해시를 블록체인에 게시하면 콘텐츠의 나이와 출처를 확인하여 데이터 출처를 증명하는 데 도움이 될 수 있습니다. 그러나 앞선 섹션과 비슷한 맥락에서 암호화 기반 솔루션의 실행 가능성을 중앙집중식 대안과 비교하여 검토해야 한다고 생각합니다.
중국과 같은 일부 국가에서는 온라인 신원을 정부가 관리하는 데이터베이스에 연결합니다. 나머지 대부분의 국가에서는 중앙화된 방식이 아니지만, KYC 제공업체 연합이 블록체인 기술과 별도로 신원 증명 솔루션을 제공할 수도 있습니다. (오늘날 인터넷 보안의 근간을 이루는 신뢰할 수 있는 인증 기관과 유사한 방식일 수도 있습니다)
또한 알고리즘이 콘텐츠의 AI 생성 여부를 감지할 수 있도록 텍스트와 이미지 출력에 숨겨진 신호를 삽입하는 AI 워터마크에 대한 연구도 진행 중입니다. Microsoft, Anthropic, Amazon을 비롯한 많은 선도적인 AI 회사들이 생성된 콘텐츠에 이러한 워터마크를 추가하기로 공개적으로 약속했습니다.
또한 기존의 많은 콘텐츠 제공업체는 이미 규정 준수를 위해 콘텐츠 메타데이터를 엄격하게 기록하는 것으로 신뢰받고 있습니다. 그 결과, 사용자들은 소셜 미디어 게시물과 관련된 메타데이터(스크린샷은 아니지만)가 중앙에 저장되어 있음에도 불구하고 이를 신뢰하는 경우가 많습니다.
여기서 중요한 점은 데이터 출처 및 신원 증명에 대한 암호화 기반 솔루션이 광범위하게 효과를 발휘하려면 사용자 플랫폼과의 통합이 추가로 필요하다는 것입니다. 따라서 신원 및 데이터 출처를 증명하기 위한 암호화 기반 솔루션은 기술적으로 실현 가능하지만, 궁극적으로 비즈니스, 규정 준수 및 규제 요건에 따라 채택 여부가 결정될 것이라고 생각합니다.
AI 내러티브 트레이딩
앞서 언급한 오버헤드에도 불구하고, 많은 AI 토큰이 4분기부터 비트코인과 이더리움은 물론이고 엔비디아, 마이크로소프트와 같은 주요 AI 주식보다 높은 성과를 보였습니다.
이는 AI 토큰이 일반적으로 더 넓은 암호화폐 시장과 관련 AI 뉴스 헤드라인 모두에서 강력한 관련 성과로부터 혜택을 받기 때문이라고 생각합니다(부록 2 참조).
결과적으로 AI 중심 토큰은 비트코인 가격이 하락할 때에도 가격 변동을 경험할 수 있으며, 이는 비트코인 하락 기간 동안 상승 변동성을 초래합니다. 그림 5는 비트코인이 하락한 날의 AI 토큰 수익률의 분산을 시각화한 것입니다.
그러나 전반적으로 볼 때, 우리는 여전히 AI 내러티브 거래에서 단기적으로 지속적인 수요 동력이 많이 부족하다고 생각합니다. 명확한 채택 예측과 지표의 부재로 인해 광범위한 메머드급 투기가 이루어지고 있으며, 이는 장기적으로 지속 가능하지 않을 수 있습니다. 결국 가격과 효용은 수렴하게 될 것입니다.
다만, 그 시간이 얼마나 걸릴지, 효용이 가격을 따라잡기 위해 상승할지 아니면 그 반대가 될지는 아직 미지수입니다. 그렇지만, 저희는 건설적인 암호화폐 시장과 뛰어난 성과를 보이는 AI 부문이 지속된다면 당분간 강력한 암호화폐-AI 스토리가 지속될 수 있다고 생각합니다.
결론
모든 탈중앙화 플랫폼은 기존의 중앙화된 대안과 경쟁하고 있으며, 더 광범위한 비즈니스 및 규제 요건의 맥락에서 분석되어야 합니다. 따라서 단순히 '탈중앙화'를 위해 중앙화된 공급자를 대체하는 것은 의미 있는 채택을 유도하기에 충분하지 않다고 생각합니다. 제너레이티브 AI 모델은 몇 년 전부터 존재해 왔으며, 시장 경쟁과 오픈 소스 소프트웨어로 인해 이미 일정 수준의 탈중앙화를 유지하고 있습니다.
이 보고서 전반에 걸쳐 반복되는 주제는 암호화폐 기반 솔루션이 기술적으로 실현 가능한 경우가 많지만, 중앙화된 플랫폼과 기능적 동등성에 도달하기 위해서는 여전히 엄청난 양의 작업이 필요하며, 이러한 플랫폼이 당분간 정체 상태에 머물지 않을 것임을 인정하는 것이었습니다.
실제로 중앙 집중식 개발은 합의 메커니즘으로 인해 탈중앙화 개발보다 더 빠른 경우가 많으며, 이는 AI처럼 빠르게 진화하는 분야에서는 문제가 될 수 있습니다.
이러한 점을 고려할 때, 저희는 AI와 암호화폐의 중첩이 아직 초기 단계에 있으며 향후 몇 년 동안 광범위한 AI 분야가 발전함에 따라 빠르게 변화할 것으로 생각합니다. 현재 암호화폐 업계에서 많은 사람들이 구상하고 있는 탈중앙화된 AI의 미래는 보장되지 않으며, 사실 AI 산업 자체의 미래는 아직 크게 결정되지 않았습니다.
따라서 저희는 이러한 시장을 신중하게 탐색하고 암호화폐 기반 솔루션이 진정으로 의미 있게 더 나은 대안을 제공할 수 있는지, 또는 최소한 기본 거래 내러티브를 이해하는 것이 현명하다고 생각합니다.
부록 1: 비트텐서 (BitTensor)
비트텐서는 32개의 서브넷에 걸쳐 다양한 인텔리전스 시장에 인센티브를 제공합니다. 이는 서브넷 소유자가 게임과 같은 제약 조건을 만들어 정보 제공자로부터 인텔리전스를 추출할 수 있게 함으로써 벤치마킹의 몇 가지 문제를 해결하는 것을 목표로 합니다.
예를 들어, 주력 서브넷 1은 텍스트 프롬프트를 중심으로 "해당 서브넷의 서브넷 검증자가 보낸 프롬프트에 대한 응답으로 가장 좋은 프롬프트 완성을 생성"하는 마이너에게 인센티브를 제공합니다. 즉, 해당 서브넷의 다른 검증자가 판단한 대로 주어진 프롬프트에 대해 가장 좋은 텍스트 응답을 생성하는 채굴자에게 보상을 제공합니다. 이를 통해 다양한 시장에서 모델을 만들려는 네트워크 참여자들의 인텔리전스 경제가 가능해졌습니다.
그러나 이러한 검증 및 보상 메커니즘은 아직 초기 단계에 있으며, 특히 편향성이 있는 다른 모델로 모델을 평가하는 경우 적대적인 공격에 노출되어 있습니다(특정 서브넷에서 평가에 사용되는 새로운 합성 데이터를 통해 진전이 이루어지고 있기는 하지만). 이는 평가 지표가 주관적일 수 있는 언어나 예술과 같은 "퍼지" 결과물의 경우 특히 그러하며, 따라서 모델 성능에 대한 여러 벤치마크가 등장하고 있습니다.
예를 들어, 실제로 비트텐서의 서브넷 1의 유효성 검사 메커니즘은 다음을 요구합니다:
검증자는 모든 채굴자 응답이 비교되는 하나 이상의 참조 답변을 생성해야 합니다. 참조 답변과 가장 유사한 답변이 가장 높은 보상을 받게 되며, 궁극적으로 가장 많은 인센티브를 얻게 됩니다.
현재 유사도 알고리즘은 문자열 리터럴과 의미론적 매칭의 조합을 보상의 기초로 사용하지만, 한정된 참조 답변 세트에서는 다양한 문체 선호도를 고려하기 어렵습니다.
또한, 비트텐서의 인센티브 구조에서 발생하는 모델이 궁극적으로 중앙 집중식 모델을 능가할 수 있을지(또는 최고 성능의 모델이 비트텐서로 이동할지) 또는 크기와 기본 계산 비용과 같은 다른 절충 요소를 어떻게 수용할 수 있을지도 불분명합니다. 사용자가 자신의 선호도에 맞는 모델을 자유롭게 선택할 수 있는 시장에서는 '보이지 않는 손'을 통해 유사한 리소스 할당을 달성할 수 있을 것입니다.
그렇긴 하지만, 비트텐서는 확장되는 문제 공간에서 매우 어려운 문제를 해결하려고 시도하고 있습니다.
부록 2: 월드코인(WorldCoin)
AI 토큰이 AI 시장의 헤드라인을 추적하는 가장 명확한 예는 아마도 월드코인의 사례일 것입니다. 2023년 12월 13일에 월드코인 2.0 업그레이드를 발표했지만 거의 주목받지 못하다가 12월 15일에 샘 알트먼이 월드코인을 홍보한 이후 50% 상승했습니다. (샘 알트먼이 월드코인의 개발사인 툴스 포 휴머니티의 공동 창립자이기 때문에 월드코인의 미래에 대한 추측이 난무하고 있습니다)
마찬가지로 2024년 2월 15일에 OpenAI의 소라가 출시되었을 때 월드코인의 트위터나 블로그에 관련 발표가 없었음에도 불구하고 가격이 3배 가까이 상승했습니다(차트 6 참조).
이 글을 게시하는 현재, 월드코인의 완전 희석 가치는 800억 달러로, 오픈AI의 2월 16일 평가액 860억 달러(연간 20억 달러의 수익을 창출하는 회사)와 비슷합니다.
본 콘텐츠는 2024년 3월 6일에 발행된 "Crypto's AI Mirage"를 번역한 것입니다. 저는 전문 번역가가 아니기 때문에 오역이 있을 수 있습니다. 또한 본 글은 원저작자의 요청에 따라 불시에 삭제될 수 있습니다. 감사합니다.