By Sean Chen, 10. listopadu 2023
Na konferenci OpenAI DevDay, která se konala 6. listopadu 2023, generální ředitel OpenAI Sam Altman opět překonal očekávání OpenAI a přinesl vývojářům AI nové možnosti. V tomto článku se podíváme na to, jaké kouzlo má GPT-4 Turbo pro softwarové vývojáře.
OpenAI uspořádala 6. listopadu 2023 konferenci OpenAI DevDay, zatímco ostatní velké technologické společnosti stále dohánějí výkon GPT-4. Generální ředitel OpenAI Sam Altman opět překonal očekávání OpenAI a poskytl vývojářům AI nové možnosti, čímž plně demonstroval vedoucí postavení OpenAI v oblasti umělé inteligence.
Kontext se vztahuje k celkovému objemu textu „vstupního promptu a konverzace“ pro velké jazykové modely. Dříve maximální objem textu podporoval až 32 000 tokenů (pouze pro některé vývojáře), zatímco GPT-4 Turbo umožňuje až 128 000 tokenů, což odpovídá možnosti zadat celou 300stránkovou knihu do GPT-4 Turbo pro generování. Co se týče rychlosti, největší nevýhodou GPT-4 byla pomalost, což často vedlo k dlouhému čekání na generování. Proto firmy stále častěji používaly GPT-3.5 pro řešení většiny praktických aplikací. GPT-4 Turbo tento problém vyřešil a rychlost generování se přiblížila GPT-3.5, což obohatilo budoucí integraci GPT-4 Turbo. Co se týče nákladů, ve srovnání s předchozí verzí GPT-4 jsou náklady na prompt třikrát levnější a náklady na výstupní text dvakrát levnější.
OpenAI letos dříve představila funkci „volání funkcí“, která umožňuje vývojářům při používání GPT volat vlastní programové funkce. Jinými slovy, umožňuje inteligentní AI propojit se s různými API, což výrazně rozšiřuje oblasti, kde může být OpenAI použita. Síla tohoto modelu spočívá v tom, že jakmile vývojáři poskytnou různé rozhraní příkazů, GPT může samo rozhodnout, který příkaz zavolat, a použít vhodné parametry k provedení.
Příklad: Vývojář chytrých senzorových žárovek poskytuje dva příkazy: „nastavit barvu“ a „nastavit časový interval senzoru“. Parametry příkazu nastavení barvy zahrnují tři možnosti: bílá, přirozená a noční světlo. Když zadáte GPT prompt: „Prosím, nastavte vhodné noční osvětlení“, GPT automaticky rozhodne použít příkaz „nastavit barvu“ a automaticky použije parametr „noční světlo“, což je proces rozhodování, který nevyžaduje lidský zásah. Dříve bylo nutné psát vlastní logiku pomocí NLP technologií k dosažení této funkce, nyní stačí použít volání GPT programu.
Aktualizace umožňuje GPT přesněji určit, který příkaz a parametry použít, a zároveň vylepšuje, že GPT může volat pouze jeden příkaz najednou. Dříve, když byla situace složitější, vývojáři museli psát programy pro více volání funkcí; tato aktualizace umožňuje GPT provádět více příkazů najednou a umožňuje, aby výsledky každého příkazu byly vzájemně předávány. Například: při použití promptu „Jsem zvyklý vstávat v noci a doplňovat tekutiny, prosím, nastavte vhodný režim osvětlení“, GPT může rozhodnout zavolat příkazy „nastavit barvu“ a „nastavit časový interval senzoru“ a rozhodnout, že parametr „časový interval“ bude „čas 01:00 až 06:30“, a zároveň použít „nastavit barvu“ s parametrem „noční světlo“.
Navíc, odpovědi jazykového modelu byly dříve ve formátu „neformátovaný text“, pokud byla požadována odpověď ve specifickém formátu, bylo nutné v promptu požádat o „odpověď ve formátu XML“; nicméně, vývojáři často čelili problémům, kdy odpověď nebyla zcela ve formátu XML a často obsahovala části čistého textu, což vedlo k chybám při převodu formátu. GPT-4 Turbo nyní umožňuje vývojářům nastavit parametr response_format, který může být nastaven na XML nebo JSON a další běžné formáty API odpovědí, což zvyšuje stabilitu programu.
Nakonec, OpenAI také umožňuje uživatelům nastavit parametr Seed, který určuje náhodnost obsahu vráceného GPT. Pomocí tohoto parametru mohou vývojáři zajistit konzistenci odpovědí jazykového modelu, což jim umožňuje psát testovací případy s větší jistotou (aby se zabránilo tomu, že jazykový model náhle poskytne odlišné odpovědi), čímž se zvyšuje testovatelnost a kvalita programu.
Kromě výše uvedených dvou bodů je z hlediska rozšíření aplikačních scénářů vydání Assistants API hlavním bodem DevDay.
Dříve, pokud jste chtěli využít velký jazykový model k vývoji generativních AI aplikací, bylo nutné použít třetí strany jako LangChain, které poskytují vyšší schopnosti velkých jazykových modelů, jako je použití více jazykových modelů, schopnost přizpůsobit data, paměť a agenti (umožňující AI provádět kontinuální úkoly a rozhodování), aby bylo možné realizovat složitější AI scénáře.
Na DevDay bylo oznámeno Assistants API, které integruje výše zmíněné schopnosti do oficiálního API, čímž se vývojářům ušetří potíže s integrací třetích stran. Toto je poprvé, kdy se oficiálně zaměřili na aplikace „agentů“ místo pouhého optimalizování výkonu velkých jazykových modelů. Oficiální dokumentace uvádí, že „asistent je cílená AI, která umožňuje použití specifických příkazů, externích dat nebo různých jazykových modelů a nástrojů k provádění úkolů“.
Nové Assistants API také obsahuje několik nástrojů, kromě výše zmíněného „volání funkcí“ také nabízí „kompilátor kódu“ a „vyhledávání dat“.
Kompilátor kódu GPT-4 umožňuje, aby vlastní kód mohl být spuštěn v sandboxovém prostředí (aktuálně podporuje pouze Python). Dříve, když inženýři získali kód napsaný pomocí GPT-4, museli jej zkopírovat a vložit do svého vývojového prostředí pro testování. Sandboxové prostředí poskytované OpenAI umožňuje GPT-4 zkontrolovat správnost kódu a postupně upravovat kód na základě výsledků, dokud není dosaženo cíle.
Nicméně, význam kompilátoru kódu přesahuje „umožnění GPT-4 zkontrolovat správnost vlastního kódu“. Jeho větší význam spočívá v tom, že „velký jazykový model má vlastní počítač“, který může provádět většinu úkolů. Nyní mohou velké jazykové modely interagovat prostřednictvím příkazového programování, ačkoli spuštění v omezeném sandboxovém prostředí umožňuje kompilátoru kódu používat pouze specifické třetí strany, ale stále je schopen provádět „většinu úkolů, které Python zvládá“, jako je zpracování dat a API volání, a číst větší soubory kódu poskytované uživateli. Sandboxové prostředí z hlediska bezpečnosti zabraňuje zneužití silných schopností velkých jazykových modelů a poskytuje určitou úroveň zabezpečení.
„Vyhledávání dat“ umožňuje uživatelům nahrát vlastní data (například data z konkrétního průmyslového odvětví, informace o produktech nebo interní dokumenty) a umožňuje velkému jazykovému modelu odpovídat na otázky týkající se těchto dat, což je aplikace ve vlastním průmyslu nebo oboru. Tato funkce byla od uvedení GPT-3 hlavním bodem zájmu. Na DevDay bylo oznámeno vyhledávání dat, což je poprvé, kdy byla pro tuto funkci poskytnuta nativní řešení, například pro vytvoření interního znalostního robota pro podniky, jako je AI projektový manažer, AI systémový analytik; v oblastech jako zdravotnictví, finance atd. chatboty, které dříve vyžadovaly složité jazykové zpracování, aby byly realizovány. Nyní, s výkonným jazykovým modelem GPT-4 a oficiální funkcí vyhledávání dat poskytovanou OpenAI, mohou vývojáři soustředit se na obchodní logiku, správnost dat a ladění detailů. Navíc, dříve potřebné vektorové databáze, zpracování datových segmentů nebo specifické vyhledávací algoritmy při použití třetích stran, již nejsou nutné díky podpoře OpenAI, což šetří čas a náklady na vývoj. OpenAI také zdůrazňuje, že konverzace a soubory používané v Assistants API nebudou použity k trénování další generace modelů OpenAI.
Celkově vzato, OpenAI nejenže neustále optimalizuje efektivitu modelu, ale také rozšiřuje aplikace velkých jazykových modelů. Sam Altman uvedl, že GPT-5 nebude v blízké době uveden, vzhledem k přesnosti GPT-4 se zdá, že není nutné vynakládat značné náklady na trénink většího modelu. Místo toho se OpenAI zaměřuje na zlepšení výkonu, použitelnosti a rozšiřitelnosti GPT-4. Pro vývojáře, podniky a koncové spotřebitele se stává klíčovým bodem digitální transformace nové generace zavedení silnějších AI, které mohou být aplikovány ve většině scénářů. GPT vytvořený OpenAI je jako mozek budoucího technologického světa a věříme, že nadcházející inovace a pokroky umožní umělé inteligenci lépe používat nástroje, „vidět“, „slyšet“ a plynule „mluvit“ a „kreslit“.
Termíny „URL“ a „doména“ vypadají podobně, ale nejsou stejné! Co se děje, když zadáte google.com do prohlížeče? Jak to souvisí s doménou a URL? Tento článek vám to jasně a prakticky vysvětlí!
READ MOREPokud jste ten typ, který si na cestách nikdy nepamatuje, kolik utratil, a je líný zapisovat si výdaje, určitě vyzkoušejte tuto super užitečnou aplikaci — „Řekni a zapiš“.
READ MORESamoobslužné objednávání se stalo prvním krokem při vstupu do restaurace a důležitou součástí našeho stravovacího zážitku. Pokud přidáme nějaké zábavné prvky, jako je AI hlasový asistent, objednávání by mohlo být intuitivnější, zábavnější a dokonce více lidské!
READ MOREKONTAKTUJTE NÁS
Pojďme si promluvit o vašich nápadech!
Nastartujte své podnikání s inovativním digitálním partnerem. Odpovíme vám do jednoho pracovního dne. (GMT+8)