Kembali

Pengenalan Mendalam OpenAI DevDay: Apa Lagi yang Diumumkan Selain GPT-4 Turbo?

By Sean Chen, Nov. 10, 2023

官網文章_OpenAI_devDay_2023.png



Pada 2023/11/06, OpenAI DevDay diadakan, dan Ketua Pegawai Eksekutif OpenAI, Sam Altman sekali lagi melampaui jangkaan, memberikan peluang baru kepada pembangun AI. Melalui artikel ini, mari kita fahami daya tarikan GPT-4 Turbo kepada pembangun perisian.




OpenAI mengadakan OpenAI DevDay pada 2023/11/06. Ketika syarikat teknologi besar lain masih berusaha mengejar prestasi GPT-4, Ketua Pegawai Eksekutif OpenAI, Sam Altman sekali lagi melampaui jangkaan, memberikan peluang baru kepada pembangun AI, menunjukkan kedudukan terkemuka OpenAI dalam kecerdasan buatan.

GPT-4 Turbo yang Luar Biasa: Lebih Pantas, Lebih Banyak Teks, dan Lebih Murah

Konteks merujuk kepada jumlah teks keseluruhan yang dimasukkan ke dalam model bahasa besar sebagai petunjuk dan dialog. Sebelum ini, jumlah teks maksimum yang disokong adalah 32,000 token (dan hanya untuk sebahagian pembangun), tetapi GPT-4 Turbo membenarkan sehingga 128,000 token, bersamaan dengan memasukkan sebuah buku 300 halaman sekaligus ke dalam GPT-4 Turbo untuk penjanaan. Dari segi kelajuan, kelemahan terbesar GPT-4 sebelum ini adalah kelajuan yang perlahan, menyebabkan banyak masa terbuang semasa menunggu penjanaan. Oleh itu, syarikat lebih cenderung menggunakan GPT-3.5 untuk menyelesaikan kebanyakan masalah aplikasi praktikal. GPT-4 Turbo menyelesaikan masalah ini, menjadikan kelajuan penjanaan hampir setara dengan GPT-3.5, dan memperkayakan senario integrasi masa depan dengan GPT-4 Turbo. Dari segi kos, berbanding dengan versi sebelumnya GPT-4, kos petunjuk adalah dua kali lebih murah (3x lebih murah), dan kos teks keluaran juga dua kali lebih murah (2x lebih murah).


Fungsi Panggilan Fungsi yang Lebih Mesra Pembangun


Apa itu Panggilan Fungsi?

OpenAI telah melancarkan fungsi "Panggilan Fungsi" awal tahun ini, membolehkan pembangun memanggil fungsi kod tersuai semasa menggunakan GPT. Dalam erti kata lain, ia membolehkan AI pintar menyambung ke pelbagai API, secara signifikan meningkatkan bidang penggunaan OpenAI. Prestasi model ini terletak pada keupayaannya untuk membiarkan pembangun menyediakan pelbagai antara muka arahan program, dan GPT boleh memutuskan sendiri arahan mana yang hendak dipanggil dan menggunakan parameter yang sesuai untuk pelaksanaan.

Contoh: Pembangun lampu pintar menyediakan dua arahan: "tetapkan warna" dan "tetapkan tempoh pengesanan". Arahan tetapkan warna mempunyai tiga parameter: cahaya putih, cahaya semula jadi, dan lampu malam. Apabila GPT diberi petunjuk: "Sila tetapkan lampu yang sesuai untuk malam", GPT akan secara automatik memutuskan untuk menggunakan arahan "tetapkan warna" dan secara automatik menggunakan parameter "lampu malam", tanpa memerlukan campur tangan manusia. Sebelum ini, teknologi NLP diperlukan untuk menulis logik tersuai untuk mencapai fungsi ini, tetapi kini hanya memerlukan panggilan program GPT.

Apa yang Diubah Kali Ini?

Kemaskini kali ini membolehkan GPT membuat keputusan yang lebih tepat tentang arahan dan parameter mana yang harus digunakan, serta memperbaiki GPT yang hanya boleh memanggil satu arahan pada satu masa. Sebelum ini, apabila senario lebih kompleks, pembangun perlu menulis program tambahan untuk membolehkan fungsi membuat panggilan berulang; kemaskini kali ini membolehkan GPT melaksanakan pelbagai arahan sekaligus dan membolehkan hasil setiap arahan disampaikan antara satu sama lain. Sebagai contoh: menggunakan petunjuk "Saya biasa bangun tengah malam untuk minum air, sila tetapkan mod lampu yang sesuai", GPT boleh memutuskan untuk memanggil arahan "tetapkan warna" dan "tetapkan tempoh pengesanan", dan memutuskan parameter "tempoh pengesanan" sebagai "masa 01:00 hingga 06:30", serta menggunakan "tetapkan warna" dengan parameter "lampu malam".

Selain itu, model bahasa sebelum ini menjawab dengan "teks dalam format tidak spesifik", jika ingin menjawab dalam format tertentu, perlu meminta dalam petunjuk "sila jawab dalam format xml"; namun, masalah yang sering dihadapi pembangun adalah: format jawapan tidak semestinya xml, sering bercampur dengan teks biasa, menyebabkan kesalahan dalam penukaran format. GPT-4 Turbo kali ini membenarkan pembangun menetapkan parameter response_format, boleh ditetapkan sebagai xml atau json, format API yang biasa, meningkatkan kestabilan program.

Akhirnya, OpenAI juga membenarkan pengguna menetapkan parameter Seed, yang menentukan kebolehubahan kandungan yang dikembalikan oleh GPT. Dengan menetapkan parameter ini, pembangun boleh memastikan konsistensi jawapan model bahasa, memberikan keyakinan lebih kepada pembangun semasa menulis kes ujian (mengelakkan model bahasa tiba-tiba menghasilkan jawapan yang berbeza), meningkatkan kebolehujian dan kualiti program.


Selain dua perkara yang diumumkan di atas, dari segi pengembangan senario aplikasi, pelancaran API pembantu adalah acara utama DevDay.

API Pembantu (Assistants API)

Sebelum ini, jika ingin menggunakan model bahasa besar untuk membangunkan aplikasi AI generatif, perlu menggunakan kit pihak ketiga seperti LangChain, memberikan model bahasa besar keupayaan yang lebih tinggi, seperti: penggunaan model pelbagai bahasa, keupayaan data tersuai, memori dan agen (Agent, membolehkan AI melaksanakan tugas berterusan, keupayaan membuat keputusan berterusan), untuk menyelesaikan aplikasi senario AI yang lebih kompleks.

API pembantu yang diumumkan di DevDay mengintegrasikan pelbagai keupayaan yang disebutkan di atas ke dalam API rasmi, menghapuskan pelbagai masalah yang dihadapi pembangun semasa mengintegrasikan kit pihak ketiga. Ini juga kali pertama pihak rasmi melangkah keluar dari sekadar mengoptimumkan prestasi model bahasa besar, dan mula meneroka aplikasi "agen". Dokumen rasmi menyatakan "seorang pembantu adalah AI yang berorientasikan matlamat, AI ini membenarkan penggunaan arahan tertentu, penggunaan data luaran atau penggunaan model bahasa dan alat yang berbeza untuk melaksanakan tugas".


API pembantu baru juga dilengkapi dengan beberapa alat, selain "panggilan fungsi" yang disebutkan di atas, ia juga menyediakan "penterjemah kod" dan "pengambilan data".


Penterjemah Kod (Code Interpreter)

"Penterjemah Kod" GPT-4 membenarkan kod yang ditulis sendiri dijalankan dalam persekitaran kotak pasir (buat masa ini hanya menyokong Python), sebelum ini jurutera perlu menyalin dan menampal kod yang dibantu oleh GPT-4 ke dalam persekitaran pembangunan mereka sendiri untuk ujian, tetapi persekitaran kotak pasir yang disediakan oleh OpenAI sudah cukup untuk membolehkan GPT-4 menyemak sendiri sama ada kod itu betul, dan boleh mengubah kod secara beransur-ansur berdasarkan hasil pelaksanaan sehingga mencapai matlamat.

Namun, fungsi penterjemah kod jauh lebih besar daripada "membolehkan GPT-4 menyemak ketepatan kod yang ditulis sendiri". Makna yang lebih besar adalah: "membolehkan model bahasa besar memiliki komputer sendiri". Komputer ini boleh melaksanakan kebanyakan tugas. Sekarang model bahasa besar boleh berinteraksi dengan cara program arahan, walaupun dijalankan dalam persekitaran kotak pasir yang terhad membolehkan penterjemah kod hanya menggunakan kit pihak ketiga tertentu, tetapi ia sudah cukup untuk melaksanakan "kebanyakan tugas yang Python pandai mengendalikan", seperti: pemprosesan data dan panggilan API, dan boleh membaca fail kod yang lebih besar yang disediakan oleh pengguna. Dari segi keselamatan, persekitaran kotak pasir boleh mengelakkan penyalahgunaan keupayaan kuat model bahasa besar, dan oleh itu mempunyai tahap jaminan keselamatan tertentu.



Pengambilan Data (Retrieval)

"Pengambilan Data" membolehkan pengguna memuat naik data mereka sendiri (contohnya: data bidang industri tertentu, maklumat produk atau dokumen dalaman) dan membolehkan model bahasa besar menjawab berdasarkan data ini, digunakan dalam industri atau bidang mereka sendiri. Fungsi ini telah menjadi tumpuan sejak GPT-3 dilancarkan. Pengambilan data yang diumumkan di DevDay adalah kali pertama pihak rasmi menyediakan penyelesaian asli untuk fungsi ini, contohnya: membolehkan syarikat membina robot pengetahuan dalaman, seperti pengurus projek AI, penganalisis sistem AI; dalam bidang perubatan, kewangan dan lain-lain, robot perkhidmatan pelanggan, yang sebelum ini memerlukan teknologi pemprosesan bahasa yang kompleks untuk dilaksanakan, kini dengan model bahasa kuat GPT-4, dan di bawah fungsi pengambilan data yang disediakan oleh OpenAI, membolehkan pembangun memberi tumpuan kepada logik perniagaan, ketepatan data dan penyesuaian butiran. Selain itu, penggunaan kit pihak ketiga sebelum ini memerlukan pangkalan data vektor, pemprosesan data segmen atau algoritma carian tertentu, di bawah sokongan rasmi OpenAI, tidak perlu lagi menguruskan proses pembangunan di atas dan kos yang berkaitan. OpenAI juga menekankan bahawa perbualan dan fail yang digunakan oleh API pembantu tidak akan digunakan untuk melatih model generasi seterusnya OpenAI.



Kesimpulan

Secara keseluruhan, OpenAI bukan sahaja terus mengoptimumkan kecekapan model, tetapi juga terus mengembangkan aplikasi model bahasa besar. Sam Altman pernah berkata GPT-5 tidak akan dilancarkan dalam masa terdekat, dengan ketepatan GPT-4 sekarang, perbelanjaan kos yang besar untuk melatih model bahasa dengan parameter yang lebih besar nampaknya tidak perlu, sebaliknya meningkatkan prestasi, kemudahan penggunaan dan kebolehskalaan GPT-4 adalah fokus utama OpenAI pada masa ini; dan bagi pembangun, syarikat dan pengguna akhir, memperkenalkan AI yang lebih kuat dan boleh digunakan dalam kebanyakan senario telah menjadi tumpuan transformasi digital generasi seterusnya. GPT yang dicipta oleh OpenAI adalah seperti otak dalam dunia teknologi masa depan, dan kami percaya, penciptaan dan kemajuan seterusnya akan menjadikan kecerdasan buatan lebih mahir menggunakan alat, dan dapat "melihat", "mendengar" dan lancar "bercakap" dan "melukis".

LEBIH DARI BLOG KAMI

Hubungi Kami

HUBUNGI KAMI

Mari bincang tentang idea anda!

Mulakan perniagaan anda dengan rakan digital inovatif anda. Kami akan membalas dalam satu hari bekerja. (GMT+8)