Hirdetés

A gyártást turbózza fel a Foxconn saját nagy nyelvi modellje

FoxBrain néven a Foxconn is bemutatta az első nagy nyelvi modelljét. Nem chatbothoz készült.

A tajvani Foxconn is bemutatta az első nagy nyelvi modelljét – ez azonban nem chatbotokhoz készült, hanem a gyártást fejlesztenék vele, valamint az ellátási lánc kezelését. A világ legnagyobb elektronikai bérgyártója olyan készülékeket szerel össze, mint az Apple iPhone-ok vagy az NVIDIA AI-szerverei.

A FoxBrain modellt 120 NVIDIA H100 GPU-val 4 hét alatt tréningezték. Azt is elárulták, hogy a Meta Llama 3.1-es architektúrájára építenek. A tréningezést az NVIDIA és a helyi szuperszámítógépe segítette.

Ez lett egyébként Tajvan első érvelésre képes nagy nyelvi modellje, amit kínai és tajvani nyelvi stílusokra optimalizáltak. A cég szerint teljesítményben nem érik utol a DeepSeeket, de nem maradnak le sokkal a legjobbaktól.

A FoxBrain adatelemzés, döntéstámogatás, dokumentumokkal való együttműködés, számolások, érvelés, problémamegoldás és kódgenerálás céljából is bevethető. A jövőben partnerekkel terjesztenék ki az alkalmazását, megosztanák a nyílt forráskódú információkat, valamint hirdetnék az AI-t a gyártás, ellátási lánc és intelligens döntéshozatal kapcsán.

A további részleteket az NVIDIA GTC fejlesztői konferenciáján hozzák nyilvánosságra.

Előzmények