OpenAI új nyílt forráskódú modelljei: Miért fontosak?

OpenAI legújabb fejlesztései, amelyek az újonnan bevezetett nyílt forráskódú modellek köré összpontosulnak, jelentős hatással bírnak a mesterséges intelligencia és a gépi tanulás területén. Az OpenAI két új nyílt súlyú nyelvi modellt jelentett be az Apache 2.0 engedély alatt, amelyek célja, hogy erős teljesítményt nyújtsanak valós környezetben, anélkül, hogy drága infrastruktúrára lenne szükség.

Valós teljesítmény alacsonyabb költséggel

A két új modell a gpt-oss-120b (117 milliárd paraméter) és a gpt-oss-20b (21 milliárd paraméter). A gpt-oss-120b modell teljesítménye megegyezik az OpenAI o4-mini modelljével a logikai tesztek során, miközben csupán egy 80 GB-os GPU-ra van szüksége. A kisebb gpt-oss-20b modell pedig hasonlóan teljesít az o3-minihez, és akár 16 GB-os GPU-val is hatékonyan futtatható. Ez lehetővé teszi a fejlesztők számára, hogy ezeket a modelleket fogyasztói gépeken futtassák, ezáltal csökkentve a költségeiket és a bonyolultságot.

Fejlett logikai feldolgozás és integrációs lehetőségek

Az OpenAI által bemutatott modellek nemcsak a logikai feladatokban, hanem az eszközhasználatban is felülmúlják a hasonló méretű más nyílt forráskódú modelleket. Az OpenAI nyilatkozata szerint ezek a modellek kompatibilisek a Responses API-val, és képesek olyan bonyolult feladatokra is, mint a webes keresés vagy Python kód végrehajtása, ami különösen érdekes a GPT-5 árazása szempontjából. A modellek emellett teljes mértékben testre szabhatók, támogatják a lánc gondolat (CoT) feldolgozását, valamint a strukturált kimeneteket, ami lehetővé teszi a felhasználók számára, hogy a saját igényeik szerint formálják őket.

Az OpenAI a fejlesztők támogatására irányuló útmutatókat is kiadott, amelyek segítik a modellek integrálását olyan platformokra, mint a Hugging Face, GitHub és mások. Ezek a modellek nemcsak hogy testreszabhatók, hanem a biztonság érdekében is külön figyelmet fordítanak a potenciális kockázatok minimalizálására is.

A biztonság és a felelősségteljes felhasználás kérdései

A nyílt súlyú modellek fejlesztésekor az OpenAI kiemelt figyelmet fordított a biztonságra. A tesztelések során bebizonyosodott, hogy még szándékosan rosszindulatú finomhangolás esetén sem érte el a gpt-oss-120b a veszélyes szintet biológiai, kémiai vagy kiber kockázatok terén. Az OpenAI szándékosan nem alkalmazott közvetlen optimalizálási nyomást a CoT-ra, hogy megőrizzék a modellek átláthatóságát és monitorozhatóságát. Ez a megközelítés azonban a modellek „hallucinációs” eredményeinek növekedéséhez vezetett, amely a nem kívánt tartalmak megjelenését jelenti.

A nyílt forráskódú modellek teljesítménye a hallucinációs tesztek során gyengébben szerepelt, mint az OpenAI o4-mini, amelyet a méretbeli különbségek indokolnak. Ugyanakkor a valós alkalmazásokban, ahol a modellek képesek információt keresni az interneten vagy adatbázisokból kiemelni adatokat, a hallucinációk előfordulása várhatóan alacsonyabb lesz.

Mit mond a szakértő?

Megkérdeztük Császár Viktor SEO szakértőt, hogy mit gondol az OpenAI új nyílt forráskódú modelljeiről. Viktor elmondta:

„Az OpenAI új nyílt forráskódú modelljei jelentős áttörést jelentenek a mesterséges intelligencia világában, mivel lehetővé teszik, hogy a fejlesztők alacsony költség mellett hozzáférjenek a legújabb technológiákhoz. A nyílt forráskódú megközelítés nemcsak hozzáférhetőbbé teszi a technológiát, hanem ösztönzi az innovációt is, mivel a közösség képes lesz finomhangolni és testre szabni a modelleket a saját igényeik szerint. Az átláthatóság és a biztonság megőrzése azonban kulcsfontosságú, és a fejlesztőknek körültekintően kell eljárniuk az új modellek használatakor. Remélem, hogy a jövőben még több hasonló kezdeményezés fog megjelenni, amelyek elősegítik a mesterséges intelligencia felelősségteljes fejlődését.”

További információkért látogasson el Császár Viktor hivatalos weboldalára: Császár Viktor weboldal.

Forrás: SearchEngineJournal.com