Innovaatiline idufirma Vana arendab detsentraliseeritud platvormi, kus kasutajad saavad oma andmeid tehisintellekti mudelite treenimiseks pakkuda ja selle eest krüptovaluutas tasu saada. Prognoositava tehisintellekti treenimisandmete puuduse tingimustes võib see algatus kujuneda oluliseks lahenduseks.
G. Ostrov
Lähenev tehisintellekti andmekriis
Vastavalt autoriteetse instituudi Epoch AI uuringutele võib tehisintellekti tööstus aastatel 2026 kuni 2032 silmitsi seista tõsise probleemiga – uute mudelite treenimisandmete puudusega. See võib potentsiaalselt aeglustada tehisintellekti tehnoloogiate arengut, mis muutuvad järjest nõudlikumaks treenimisandmete mahu ja kvaliteedi suhtes.
Selle probleemi perspektiivse lahendusena pakub idufirma Vana põhimõtteliselt uut lähenemist andmete kogumisele. Ettevõte arendab detsentraliseeritud võrgustikku, kus tavalised kasutajad saavad pakkuda oma isikuandmeid tehisintellekti treenimiseks ja saada selle eest tasu krüptovaluuta vormis. Projekt on juba kaasanud tõsist rahastust 25 miljoni dollari ulatuses investoritelt.
Vana platvormi töömehhanism
Vana platvorm ühendab mitmeid teenuseid (üle mitme kümne), mille kaudu kasutajad saavad jagada erinevat tüüpi andmeid:
- Postitused sotsiaalvõrgustikest
- Veebilehitsejate ajalugu
- Nutikodu seadmete andmed
- Biomeertilised näitajad fitness-jälgijatelt
- Genoomide dekodeeringud ja muu isiklik informatsioon
Ettevõte on juba teatanud oma tehisintellekti mudeli nimega Collective-1 arendamisest, millel on 7 miljardit parameetrit. Eripäraks on see, et selle treenimiseks kasutatakse eranditult platvormi kasutajate andmeid. Tehnilise poole tagab süsteem Flower, mis võimaldab ühendada osalejate seadmete arvutusvõimsust neural võrgu hajutatud treenimiseks.
Praeguseks on Vana võrgustikuga liitunud üle 1,3 miljoni kasutaja. Siiski eeldavad ettevõtte ambitsioonikad plaanid selle arvu kasvu 100 miljoni osalejani. Selline mastaap võimaldab koguda umbes 453 triljonit tunnust treenimiseks – see ületab märkimisväärselt andmete mahtu, mida kasutati kaasaegsete mudelite loomiseks. Võrdluseks: Llama-3 treeniti 15 triljonil märgil ja Qwen3 36 triljonil märgil.
Tehisintellekti demokratiseerimine
Projekti põhifilosoofia seisneb tehisintellekti mudelite loomise ja omamise protsessi demokratiseerimises. Vana kaasasutaja Anna Kazlauskas sõnul: "Te ei satu olukorda, kus üks ettevõte kontrollib kõikvõimsat tehisintellekti mudelit. Tänu meie lähenemisele kuuluvad mudelid tõeliselt kasutajatele. Te saate täiuslikuma tehnoloogia ja sellest võidavad kõik."
Selline mudel võimaldab potentsiaalselt lahendada korraga mitu kaasaegse tehisintellekti tööstuse probleemi:
- Suurendada kvaliteetsete treenimisandmete kättesaadavust
- Tagada õiglane tasu isikutele, kes pakuvad oma andmeid
- Ennetada suurte korporatsioonide poolt tehisintellekti tehnoloogiate monopoliseerimist
- Suurendada andmete kogumisprotsessi läbipaistvust ja eetilisust
Siiski tekitab selline algatus ka põhjendatud küsimusi konfidentsiaalsuse, andmete turvalisuse ja potentsiaalsete riskide kohta. Paljusid kasutajaid muretseb, kui usaldusväärselt on kaitstud nende isikuandmed ja milliseid tagajärgi võib tuua nende kasutamine tehisintellekti mudelite treenimiseks.
Sellegipoolest võivad kasvava tehisintellekti andmete nõudluse ja prognoositava puuduse tingimustes sellised detsentraliseeritud platvormid saada oluliseks lüliks tuleviku tehisintellekti ökosüsteemis.
Vana projekti ametlik veebileht: https://www.vana.org
Kui teil tekib probleeme, kirjutage meile ja me aitame teid kiiresti ja kvaliteetselt!