📌 OpenAI menyerang balik DeepSeek AI dengan meluncurkan versi awal o3-Mini – inilah perbandingannya
– Pada hari Jumat, OpenAI berusaha untuk melindungi posisi pasarnya dengan meluncurkan o3-mini. Ini adalah pesaing langsung dari model R1 dari startup China DeepSeek, yang telah mengguncang industri AI dengan memberikan kinerja terbaik dengan biaya komputasi yang lebih rendah.
“Kami merilis OpenAI o3-mini. Model terbaru dan paling hemat biaya dalam seri inferensi yang tersedia saat ini di ChatGPT dan API, menurut blog resmi OpenAI.
“Diumumkan pada Desember 2024, model yang kuat dan cepat ini menggantikan OpenAI o1-. mini mendorong batas-batas yang dapat dicapai oleh model yang lebih kecil, dengan tetap mempertahankan biaya rendah dan latensi yang lebih rendah dari mini.
OpenAI juga menyediakan kemampuan inferensi kepada pengguna secara gratis untuk pertama kalinya. Tidak seperti model keluarga GPT-4o dan GPT, model AI keluarga ‘o’ berfokus pada tugas inferensi. Meskipun kurang kreatif, mereka mampu memecahkan masalah yang kompleks, kembali ke analisis yang salah, dan menghasilkan kode struktural yang lebih baik berkat rantai inferensi bawaan.
Para peneliti AI China telah mencapai apa yang banyak orang pikirkan bertahun-tahun di masa depan: OpenAI, model AI sumber terbuka gratis yang dapat menyamai atau bahkan melampaui kinerja sistem inferensi paling canggih di dunia. Hal ini dicapai dengan memungkinkan AI untuk belajar dengan cara coba-coba, dengan cara yang sama seperti manusia belajar. DeepSeek-R1-Zero adalah model yang dilatih menggunakan pembelajaran penguatan skala besar (RL) tanpa penyempurnaan yang diawasi sebelumnya (SFT) dan menunjukkan kemampuan belajar berlebihan yang luar biasa.
Model AI tingkat tertinggi OpenAI mencakup pra-generatif generatif
GPT adalah keluarga seniman, tipe otak kanan yang cocok untuk bermain peran, percakapan, kreativitas, generalisasi, penjelasan, curah pendapat, mengobrol, dll.
O adalah keluarga kutu buku. Mereka tidak bisa bercerita, tetapi mereka pandai dalam pengkodean, memecahkan rumus matematika, menganalisis masalah yang rumit, merencanakan proses penalaran langkah demi langkah, dan membandingkan karya ilmiah
Miniatur o3 yang baru hadir dalam tiga varian: rendah, sedang, dan tinggi. Subkategori ini memberikan jawaban yang lebih baik kepada pengguna dengan imbalan lebih banyak “penalaran” (lebih mahal bagi pengembang yang harus membayar token).
OpenAI o3-mini yang berorientasi pada efisiensi lebih baik dalam pengetahuan umum dan rantai penalaran multibahasa yang lebih rendah daripada OpenAI o1-mini, tetapi lebih baik dalam tugas-tugas lain seperti pengkodean dan faktisitas. Semua model lainnya (o3-mini medium dan o3-mini high) mengungguli OpenAI o1-mini di semua tolok ukur, dengan hanya menggunakan sebagian kecil daya komputasi dan mengungguli model unggulan OpenAI. Terobosan DeepSeek memicu aksi jual teknologi besar-besaran yang menghapus hampir $1 triliun di pasar AS. NVIDIA sendiri kehilangan nilai pasar sebesar $600 miliar karena investor mempertanyakan permintaan masa depan untuk chip AI yang mahal.
Perbedaan kinerja ini disebabkan oleh pendekatan baru DeepSeek terhadap arsitektur model.
Ketika perusahaan-perusahaan AS berfokus pada peningkatan daya komputasi untuk mengembangkan AI, tim DeepSeek menemukan cara untuk membuat model yang lebih sederhana dan lebih efisien dalam memproses informasi. Persaingan semakin ketat ketika raksasa teknologi Tiongkok, Alibaba, meluncurkan model Qwen2.5 Max, yang bahkan lebih kuat daripada model yang digunakan Deep Seek sebagai fondasi, sehingga membuka jalan bagi gelombang baru inovasi AI di Tiongkok.