BMS, bussi, tööstusliku, mõõteriistakaabli jaoks.

Elon Musk ja XAI meeskond käivitasid otseülekande ajal ametlikult Groki Grok3 uusima versiooni. Enne seda sündmust tõstis märkimisväärne osa seotud teavet koos Muski 24/7 reklaamhüpega GROK3 jaoks enneolematule tasemele ülemaailmsed ootused. Vaid nädal tagasi ütles Musk enesekindlalt otseülekande ajal, kommenteerides Deepseek R1 -d: "XAI kavatseb käivitada parema AI -mudeli." Live -i andmete põhjal on GROK3 väidetavalt ületanud kõik praegused tavapärased mudelid matemaatika, teaduse ja programmeerimise võrdlusalustes, kusjuures Musk väitis isegi, et Grok3 kasutatakse arvutusülesannete jaoks, mis on seotud SpaceXi Marsi missioonidega, mis ennustavad "läbimurdeid Nobeli auhinna tasemel kolme aasta jooksul." Kuid need on praegu lihtsalt Muski väited. Pärast käivitamist testisin Grok3 uusima beetaversiooni ja esitasin suurte mudelite klassikalise trikkiküsimuse: "Mis on suurem, 9.11 või 9.9?" Kahetsusväärselt ei suutnud niinimetatud nutikam GROK3 sellele küsimusele õigesti vastata. GROK3 ei suutnud küsimuse tähendust täpselt tuvastada.
See test juhtis paljude sõprade märkimisväärset tähelepanu ja juhuslikult on erinevad sarnased testid välismaal näidanud Grok3 -le, kes on hädas põhiliste füüsika/matemaatika küsimustega, näiteks "Milline pall langeb Pisa kallutustornist kõigepealt?" Seega on seda humoorikalt märgistatud kui "geenius, kes ei soovi lihtsatele küsimustele vastata".

Grok3 on hea, kuid see pole parem kui R1 või O1-Pro.
GROK3 koges paljudel tavapäraste teadmiste testidel praktikas "ebaõnnestumisi". XAI käivitusürituse ajal demonstreeris Musk GROK3 kasutamist pagulus 2 mängutee tegelasklasside ja efektide analüüsimiseks, mida ta väitis, et mängib sageli, kuid enamik Grok3 esitatud vastuseid oli valed. Muskus otseülekande ajal ei märganud seda ilmset küsimust.
See viga mitte ainult ei andnud täiendavaid tõendeid välismaiste netizenide kohta, et mõnitada muskus mängude asendaja leidmise eest, vaid tõstatas ka olulisi probleeme Grok3 usaldusväärsuse osas praktilistes rakendustes. Sellise "geeniuse" jaoks on sõltumata selle tegelikest võimalustest kahtluse all selle usaldusväärsus äärmiselt keerukate rakendusstsenaariumide korral, näiteks Marsi uurimisülesanded.
Praegu osutavad paljud testijad, kes said GROK3-le juurdepääsu, ja need, kes just eile mudeli võimalusi katsetasid, osutavad kõik ühisele järeldusele: "Grok3 on hea, kuid see pole parem kui R1 või O1-Pro."

Kriitiline perspektiiv "NVIDIA häirimisel"
Väljaande ajal ametlikult esitatud PPT-s näidati, et Grok3 on Chatbot Arenal “kaugelt ees”, kuid see nutikalt kasutatud graafilised tehnikad: edetabeli vertikaaltelg ainult loetletud tulemused tulemused ainult 1400–1300 skoori vahemikus, muutes originaalse 1% erinevuse testi tulemuste osas erakordselt oluliseks selles esitluses.

Mudeli tegelike tulemuste korral on GROK3 kõigest 1-2% ees Deepseek R1 ja GPT-4.0, mis vastab paljude kasutajate kogemustele praktilistes testides, mis ei leitud "märgatavat erinevust". GROK3 ületab oma järeltulijaid ainult 1–2%.

Ehkki Grok3 on saavutanud kõrgema kui kõigi praegu avalikult testitud mudelid, ei võta paljud seda tõsiselt: lõppude lõpuks on Xai varem kritiseeritud Grok2 ajastul "skoori manipuleerimise" eest. Kui edetabelis karistas vastuse pikkuse stiili, vähenesid hinded tunduvalt, juhtides tööstusharu siseringid sageli kritiseerima "kõrge skoorimise, kuid madala võime" nähtust.
Kas edetabeli kaudu "manipuleerimine" või illustratsioonide kujundamise trikid paljastavad XAI ja Muski kinnisidee mõiste "paki juhtimise" suhtes mudeli võimalustes. Musk maksis nende marginaalide eest järsku hinda: käivitamise ajal kiitis ta 200 000 H100 GPU -d (väites otseülekande ajal "üle 100 000") ja saavutada kogu treeninguaeg 200 miljonit tundi. See pani mõned uskuma, et see kujutab endast GPU -tööstuse jaoks veel ühte olulist õnnistust ja kaaluda Deepseeki mõju sektorile "rumalaks". Nimelt usuvad mõned, et suur arvutusjõud on mudelitreeningu tulevik.
Kuid mõned netizensid võrdlesid kahe kuu jooksul 2000 H800 GPU tarbimist, et saada Deepseek V3, arvutades, et GROK3 tegelik koolitusvõimalus on 263 korda suurem kui V3. Lüning Deepseek V3, mis viskas 1402 punkti, ja Grok3 on veidi alla 100 punkti. Pärast nende andmete avaldamist mõistsid paljud kiiresti, et Grok3 pealkirja taga on "maailma tugevaim" selge marginaalne kasutegur - tugevamat jõudlust tekitavate suuremate mudelite loogika on hakanud näitama vähenevat tulu.

Isegi kui "kõrge skoorimise, kuid madala võimega" oli Grok2-l kasutamise toetamiseks tohutul hulgal kvaliteetseid esmatasandi andmeid X (Twitter) platvormilt. GROK3 koolitusel puutus XAI aga loomulikult OpenAi silmitsi seisva "lagi" - esmaklassiliste koolitusandmete puudumine paljastab kiiresti mudeli võimaluste marginaalse kasu.
Grok3 ja Muski arendajad on tõenäoliselt esimesed, kes neid fakte sügavalt mõistavad ja tuvastavad, mistõttu Musk on sotsiaalmeedias pidevalt maininud, et versiooni kasutajad praegu on "endiselt lihtsalt beeta" ja et "täisversioon ilmub järgmistel kuudel". Musk on võtnud Grok3 tootejuhi rolli, mis viitab kasutajatele tagasisidet mitmesuguste kommentaaride jaotises.
Kuid ühe päeva jooksul tõstis Grok3 jõudlus kahtlemata neile, kes loodavad tugevamate suurte mudelite koolitamiseks tugineda "massilisele arvutuslikku lihasele": avalikult saadaoleva Microsofti teabe põhjal on OpenAi GPT-4 parameetri suurus 1,8 triljonit parameetrit, üle kümnekordse GPT-3. Kuulujutud viitavad sellele, et GPT-4,5 parameetri suurus võib olla veelgi suurem.
Kuna mudeli parameetri suurused tõusevad, tõusevad ka treeningkulud kiiresti. Grok3 kohaloleku korral peavad sellised kandidaadid nagu GPT-4,5 ja teised, kes soovivad parameetrite suuruse kaudu parema mudeli jõudluse saavutamiseks jätkata raha põletamist, arvestama lakke, mis on nüüd selgelt silmapiiril ja kaaluvad, kuidas sellest üle saada. Sel hetkel oli OpenAi endine peateadlane Ilya Sutskever eelmise aasta detsembris varem öelnud: "Eelkoolitus, mida me tunneme, saab lõppema", mis on aruteludes taastunud, ajendades püüdlusi leida suurte mudelite koolitamise tõeline tee.

Ilja vaatepunkt on tööstuses kõlanud. Ta nägi täpselt ette juurdepääsetavate uute andmete peatset ammendumist, põhjustades olukorda, kus jõudlust ei saa andmete hankimise kaudu jätkata, võrdledes seda fossiilkütuste ammendumisega. Ta osutas, et "nagu nafta, on ka Internetis inimeste loodud sisu piiratud ressurss." Sutskeveri ennustustes omavad järgmise põlvkonna mudelitel, mis järgnev koolitusjärgne põlvkond on "tõeline autonoomia" ja mõttekäik "sarnased inimese ajuga".
Erinevalt tänastest eelnevatest väljaõppinud mudelitest, mis tuginevad peamiselt sisu sobitamisele (eelnevalt õpitud mudeli sisu põhjal), saavad tulevased AI-süsteemid õppida ja luua metoodikaid probleemide lahendamiseks viisil, mis sarnaneb inimese aju "mõtlemisele". Inimene suudab saavutada põhimõttelise oskuse lihtsalt põhilise erialase kirjandusega, samas kui AI suur mudel nõuab miljoneid andmepunkte, et saavutada kõige põhilisem algtaseme efektiivsus. Isegi kui sõnastust pisut muudetakse, ei pruugi neid põhiküsimusi õigesti mõista, illustreerides, et mudel pole intelligentsuses tõeliselt paranenud: artikli alguses nimetatud põhilised samas lahendamatud küsimused on selle nähtuse selge näide.

Järeldus
Kui Grok3 tõepoolest õnnestub tööstusele tõepoolest, et "eelnevalt koolitatud mudelid lähenevad nende eesmärgile", oleks see aga valdkonnale märkimisväärselt mõju.
Võib-olla pärast seda, kui Grok3 ümbritsev meeletu alistub järk-järgult, oleme tunnistajaks rohkem juhtumitele, näiteks Fei-Fei Li näitele "suure jõudlusega mudelite häälestamine konkreetsele andmestikule kõigest 50 dollari eest", avastades lõpuks tegeliku tee AGI-le.
Juhtimiskaablid
Struktureeritud kaabeldussüsteem
Võrk ja andmed, kiudoptiline kaabel, plaastri nööri, moodulid, esiplaat
16.-18. Aprill 2024 Dubais kesk-Ida-energia
16.-18. aprill 2024 Securika Moskvas
9. mai, 2024 Uued tooted ja tehnoloogiad käivitavad Shanghais
Oktoober22.-25
19.-20. November 2024 ühendatud maailm KSA
Postiaeg: 19. veebruar-20125