보도 - 자료

Alaya AI 심층 투자 연구 web3 보고서

Alaya AI는 블록체인 기술, 영지식 증명, 공유 경제 모델, 고급 AI 데이터 라벨링 및 구성 기술을 통해 AI 산업을 발전시키도록 설계된 혁신적인 AI 데이터 주석 플랫폼입니다. 이 프로젝트를 통해 사용자는 보상을 받으면서 데이터를 기여할 수 있으며 블록체인 및 ZK 기술을 활용하여 사용자 개인정보와 데이터 소유권을 보호할 수 있습니다.

Alaya AI는 질문에 대한 사용자 참여를 통해 데이터를 수집하고 통합 AI 시스템을 활용하여 사용자 기여의 정확성을 평가하고 해당 토큰 인센티브로 보상합니다. 사용자의 NFT 레벨이 높아질수록 질문의 난이도도 점차 높아져 일반 지식부터 전문 분야까지 다양한 유형의 질문을 다룹니다. 궁극적으로 Alaya AI는 수집된 데이터를 다양한 AI 모델이 인식하고 훈련할 수 있도록 표준화합니다.

시장 분석

전통적인 경제학에서는 노동, 토지, 자본을 생산의 주요 요소로 보지만, 인공지능 시대에는 알고리즘, 데이터, 컴퓨팅 능력이 새로운 생산의 삼두가 되는 등 논리가 미묘하게 바뀌었을 수도 있습니다. 현재 대규모 언어 모델 탐색의 경우 알고리즘 조정은 여전히 ​​Transformer 기술을 기반으로 하며 컴퓨팅 성능은 계속해서 향상됩니다. 그러나 고품질 데이터는 모델과 알고리즘의 혁신을 제한하는 주요 지표로 남아 있습니다. 기업이 자체 AI 모델 교육을 시작하면서 데이터에 대한 수요가 급증하고 있습니다.

전통적인 세계에서 데이터 주석 사업은 Scale AI, Appen, Lionbridge 및 CloudFactory를 비롯한 유명 기업을 통해 수십억 달러 규모의 시장을 지원해 왔습니다. 그러나 전통적인 데이터 주석 사업은 글로벌 사용자 기반에 도달하는 데 어려움을 겪어 왔으며, 이는 서로 다른 지역 간의 불평등을 악화시켰습니다. 보고서에 따르면 OpenAI를 활용하는 케냐의 아웃소싱 데이터 주석 작성자는 시간당 1.5달러 미만의 수입을 올리고 하루에 약 200,000단어에 주석을 다는 것으로 나타났습니다.

Web3에서는 블록체인 기술을 활용하여 데이터 소유권이 개별 데이터 제공자에게 속할 수 있습니다. 분산형 데이터 저장 및 거래 메커니즘을 통해 개인은 자신의 데이터 자산을 더 잘 제어하고 주문형 거래 및 승인을 촉진하여 상응하는 인센티브와 보상을 얻을 수 있습니다. 이 모델은 데이터 주석자의 권리를 더 잘 보호합니다. 블록체인의 불변성과 추적성 기능을 통해 Web3 데이터 서비스는 더 높은 투명성과 신뢰성을 제공할 수 있습니다. 모든 데이터 거래, 주석 작업 할당 및 완료 상태는 체인에 기록되어 확인이 가능하므로 사기 및 불법 행위의 가능성이 줄어듭니다. 데이터 사용자는 추가적인 신뢰 보증 없이 체인의 데이터만 신뢰할 수 있습니다.

제품 디자인

사용자 참여 장벽을 낮추기 위해 Alaya AI는 사용자 개인 정보가 손상되지 않도록 암호화 알고리즘을 사용하면서 질문에 답하는 형태로 사용자 상호 작용을 통해 데이터를 수집하는 게임화된 제품을 설계했습니다.

AI를 위해, AI에 의해. 강화학습 개념과 마찬가지로 알라야 AI는 AI를 제품 내에 통합해 데이터의 품질을 파악하고 AI 데이터에 대한 사용자 판단의 정확성을 평가해 기여도를 판단해 그에 따른 인센티브를 제공한다. 또한 Alaya AI는 주석이 달린 결과의 분산 검증을 위해 평판 메커니즘과 품질 검증 노드를 도입할 예정입니다. 품질 검증 노드에 의한 무작위 샘플링 및 교차 검증을 통해 오류나 악의적인 주석을 보다 효율적으로 식별하고 고품질의 주석 결과를 유지할 수 있습니다. 작업 할당에서 Alaya AI는 AI 알고리즘 지원 작업 할당 방법을 사용하여 작업을 사용자와 효율적으로 일치시킵니다. 사용자가 고품질의 데이터를 많이 제공할수록 NFT 레벨이 높아지고 그에 따라 질문의 난이도도 높아집니다. 일반적인 상식적인 질문부터 특정 분야(예: 운전, 게임, 영화, TV), 그리고 마지막으로 고급 분야(의료, 기술, 알고리즘)에 이르기까지 질문의 복잡성은 더욱 커집니다.

타당성 분석

전통적인 데이터 주석 회사에서는 직원을 착취한다는 의혹이 있지만 이는 회사의 수익성에 크게 도움이 됩니다. Web3 데이터 주석은 보다 공평한 방식으로 인간 복지를 향상시킬 수 있지만 경제적으로 플랫폼 수익을 감소시킬 수 있습니까? 실제로 Alaya AI는 다양성을 추가하여 전반적인 유용성을 높입니다.

기존의 데이터 주석 방법은 높은 개별 작업량을 요구할 뿐만 아니라 샘플 품질을 보장하는 데 어려움을 겪습니다. 주석 보상이 낮기 때문에 플랫폼은 주로 교육 수준이 일반적으로 낮은 개발도상국의 사용자를 모집하므로 제출된 샘플의 다양성이 부족합니다. 전문 지식이 필요한 고급 AI 모델의 경우 플랫폼은 적합한 주석자를 모집하는 데 어려움을 겪습니다.

토큰/NFT 보상과 추천 보너스를 통합함으로써 Alaya는 소셜 및 게임 요소를 일반적인 데이터 주석 작업에 결합하여 커뮤니티 규모를 효과적으로 확장하고 일일 체크인과 같은 활동을 통해 유지율을 향상시킵니다. Alaya의 바이럴 추천 시스템은 개별 사용자의 작업별 보상 금액을 제어하는 ​​동시에 소셜 네트워크의 확장에 따라 고품질 사용자의 수익이 무한히 증가할 수 있도록 합니다.

기본적으로 Web2 시대의 중앙집중형 데이터 플랫폼은 소수의 사용자에 크게 의존하여 대량의 샘플을 지속적으로 제공하는 반면, Alaya는 참여하는 사용자 수를 늘리면서 개별 사용자가 기여하는 데이터의 양을 줄입니다. 개인의 작업량이 줄어들수록 기여된 데이터의 품질이 크게 향상되고 데이터 대표성이 크게 향상됩니다. 더 큰 사용자 기반에 도달하면 분산형 데이터 주석 플랫폼은 인류의 집단 지능을 보다 정확하게 나타내는 데이터를 수집하여 샘플링 편향을 제거합니다.

개별 사용자의 문제 영역에 대한 익숙하지 않음/악의적으로 제출된 오답이 데이터 품질에 영향을 미치는 것을 방지하기 위해 Alaya AI 플랫폼은 정규 분포 모델을 채택하여 데이터를 검증하고 극값을 자동으로 제외하거나 표준화합니다. 또한 Alaya는 독점적인 최적화 알고리즘을 활용하여 사용자 답변과 가중치를 상호 참조하여 확인함으로써 수동 검사 및 수정의 필요성을 제거하고 데이터 비용을 더욱 절감합니다. 데이터 유효성 임계값은 과잉 수정을 방지하고 데이터 왜곡을 최소화하기 위해 각 작업의 샘플 크기에 따라 동적으로 조정됩니다.

기술적 기능들

Alaya AI는 데이터 생산자(개인 사용자)와 데이터 소비자(AI 모델) 사이의 중개자로서 사용자가 주석을 단 데이터를 수집하고 처리하여 AI 모델에 전달합니다.

Alaya AI는 혁신적인 마이크로 데이터 모델(Tiny Data)을 채택하여 기존 빅 데이터를 최적화하고 반복하여 여러 측면에서 딥 러닝 훈련 효과를 향상시킵니다.

  1. 데이터 품질 최적화: 마이크로 데이터 모델은 고품질 소규모 데이터 세트에 중점을 두고 데이터 정리 및 라벨링 최적화를 통해 데이터 정확성과 일관성을 향상시킵니다. 고품질 교육 데이터는 모델 일반화 및 견고성을 효과적으로 향상시켜 시끄러운 데이터가 모델 성능에 미치는 부정적인 영향을 줄입니다.
  2. 데이터 특징 압축: 마이크로 데이터 모델은 특징 엔지니어링 및 데이터 압축 기술을 사용하여 주요 특징을 추출하고 중복되고 관련 없는 정보를 제거합니다. 압축된 데이터 세트에는 더 높은 밀도의 유용한 정보가 포함되어 있어 모델 수렴 속도를 가속화하는 동시에 계산 리소스 소비를 줄입니다.
  3. 샘플 균형 최적화: 딥 러닝 모델의 성능은 불균형한 데이터 분포의 영향을 받는 경우가 많습니다. 마이크로 데이터 모델은 지능형 데이터 샘플링 전략을 활용하여 다양한 범주의 샘플 균형을 유지함으로써 모델이 각 범주에 충분한 훈련 데이터를 갖도록 하여 분류 정확도를 향상시킵니다.
  4. 능동적 학습 전략: 마이크로 데이터 모델은 모델 피드백을 기반으로 데이터 선택 및 주석 프로세스를 동적으로 조정하는 능동적 학습 전략을 도입합니다. Active Learning은 모델 개선에 가장 큰 영향을 미치는 샘플에 주석을 우선적으로 적용하여 비효율적인 반복 작업을 방지하고 데이터 활용 효율성을 향상시킵니다.
  5. 증분 학습 메커니즘: 마이크로 데이터 모델은 증분 학습을 지원하여 기존 모델에 대한 교육을 위한 새로운 데이터를 지속적으로 추가하고 모델 성능의 반복 최적화를 달성합니다. 증분 학습을 통해 모델은 지속적으로 학습하고 발전하여 변화하는 애플리케이션 시나리오 요구 사항에 적응할 수 있습니다.
  6. 전이 학습 기능: 마이크로 데이터 모델은 전이 학습 기능을 갖추고 있어 훈련된 모델을 유사한 새로운 작업에 적용할 수 있어 새로운 작업에 대한 데이터 요구 사항과 훈련 시간을 크게 줄일 수 있습니다. 지식 전달 및 재사용을 통해 마이크로 데이터 모델은 소규모 샘플 시나리오에서 우수한 교육 효과를 얻을 수 있습니다.

또한 Alaya AI는 AI 교육 및 배포 도구를 통합하여 일반적인 딥 러닝 프레임워크를 지원하고 다양한 AI 모델이 이를 직접 인식하고 활용할 수 있도록 하여 업스트림 모델 교육 비용을 절감합니다. 또한, Alaya AI는 영지식 증명 및 접근 제어 기술과 같은 암호화 알고리즘을 활용하여 프로세스 전반에 걸쳐 사용자 개인 정보가 침해되지 않도록 완벽하게 보호합니다.

생태발전

현재 Alaya AI는 Arbitrum과 opBnB라는 두 가지 주요 메인넷을 지원하며 이메일을 통한 등록이 가능합니다. 모바일 앱은 이미 Google Play에서 사용할 수 있습니다.

비즈니스 관점에서 Alaya AI는 10개가 넘는 AI 기술 기업과 안정적인 파트너십을 구축했으며, 협력 건수도 계속 증가하고 있습니다. 이를 통해 Alaya는 안정적인 현금 흐름 실현을 달성하여 사용자에게 지속적으로 현금 및 토큰 보상을 제공할 수 있습니다.

소비자 관점에서 Alaya AI는 현재 400,000명 이상의 등록 사용자와 20,000명 이상의 일일 활성 사용자를 자랑하며 매일 1,500건 이상의 온체인 거래를 촉진합니다. 또한 Alaya는 제품의 방향을 공개적이고 투명하며 민주적으로 결정할 분산형 자율 커뮤니티를 구축했습니다.

앞으로 Alaya AI는 DePIN과 더욱 통합되어 통합 AI 스마트 하드웨어 제품(예: Rabbit R1)에 내장되어 사용자의 일상 상호 작용에서 데이터를 수집하고 장치의 유휴 컴퓨팅 성능을 활용하는 것을 목표로 합니다. 또한 Alaya AI는 분산 컴퓨팅 플랫폼(예: Akash 및 Golem)과의 협력을 통해 AI 데이터 및 컴퓨팅 성능을 위한 통합 시장을 구축할 수 있으므로 AI 개발자는 알고리즘 최적화에만 집중할 수 있습니다. 데이터 저장과 관련하여 Alaya AI는 IPFS 및 Arweave와 같은 분산형 스토리지 프로토콜을 사용하여 주석이 달린 데이터를 저장할 수 있으며 분산형 AI 모델 시장(예: Bittensor)과 적극적으로 협력하여 분산형 데이터로 분산형 모델을 교육할 수 있습니다.

토큰 인센티브

Alaya AI의 토큰 시스템은 주로 사용자 인센티브와 생태계 인센티브라는 두 부분으로 구성됩니다.

첫 번째 부분은 Alaya의 기본 플랫폼 인센티브 토큰 역할을 하는 AIA 토큰입니다. 사용자는 작업 완료, 마일스톤 달성 및 제품 내 기타 활동 참여에 대한 보상으로 AIA 토큰을 받습니다. AIA 토큰은 사용자 NFT 업그레이드, 이벤트 참여 및 고유한 업적 획득에도 사용할 수 있으며, 이 모든 것이 제품 내에서 플레이어의 기본 출력을 향상시킵니다. AIA 토큰은 기본 출력 및 소비 시나리오를 가지고 있으며 두 측면이 서로를 강화합니다.

두 번째 부분은 Alaya의 거버넌스 토큰 역할을 하는 AGT 토큰으로, 최대 발행량은 50억 개입니다. AGT는 생태계 개발, 고급 NFT 업그레이드, 커뮤니티 거버넌스 활동 참여에 사용됩니다. 사용자는 커뮤니티 거버넌스, 데이터 검토 및 요청 발행에 참여하기 위해 AGT를 보유해야 합니다.

Alaya AI의 이중 토큰 모델은 거버넌스에서 경제적 인센티브를 분리함으로써 시스템 경제적 인센티브의 안정성에 영향을 미칠 수 있는 거버넌스 토큰의 상당한 변동을 방지합니다. 이는 시스템의 전반적인 확장성을 향상시키고 장기적인 양성 개발에 더 도움이 됩니다.

경쟁 분석

기존 분산형 데이터 라벨링 프로젝트의 비교는 다음과 같습니다.

경쟁 분석 관점에서 볼 때, 새로운 프로젝트는 이전 프로젝트에 비해 토큰 성능 측면에서 더 나은 성과를 낼 가능성이 높습니다. 또한 실제 사용자 데이터를 지원하는 프로젝트는 사용자가 부족한 프로젝트보다 훨씬 더 나은 성능을 발휘합니다. 신흥 프로젝트인 Alaya AI는 400,000명 이상의 등록 사용자, 20,000명 이상의 일일 활성 사용자, 매일 1,500건 이상의 온체인 거래를 보유하고 있으며 토큰 발행 후 더 나은 가치 지원을 받을 가능성이 높습니다.

참조:

홈페이지: https://www.aialaya.io/

트위터: https://twitter.com/Alaya_AI

텔레그램: https://t.me/Alaya_AI

매체: https://medium.com/@alaya-ai

덱: https://docsend.com/view/tvrctaq5hyen5max

가장 인기있는

To Top