Teknologi AI China DeepSeek. DeepSeek, demikian nama lab tersebut, meluncurkan model bahasa besar atau large language model sumber terbuka gratis pada akhir Desember. Kabarnya, hanya butuh waktu dua bulan dan kurang dari USD 6 juta untuk membangunnya, menggunakan chip kemampuan rendah dari Nvidia yang disebut H800.
Sebuah laboratorium kecerdasan buatan atau AI yang kurang dikenal di China, memicu kepanikan di Silicon Valley. Sebab, mereka merilis model AI yang dinilai dapat mengungguli yang terbaik di Amerika meskipun dibuat dengan biaya yang lebih murah dan dengan chip kurang bertenaga.
Teknologi AI China DeepSeek
Perkembangan baru ini menimbulkan kekhawatiran tentang apakah keunggulan global Amerika dalam kecerdasan buatan menyusut. Selain itu, juga timbul pertanyaan tentang pengeluaran besar-besaran perusahaan teknologi besar untuk membangun model AI dan pusat data.
Itu berkat peluncuran DeepSeek-R1, model bahasa besar atau large language model (LLM) baru. Model AI ini mampu melakukan “penalaran” mirip dengan model terbaik dari OpenAI saat ini, yaitu o1. Model semacam itu hanya perlu beberapa detik atau menit untuk menjawab pertanyaan sulit dan memecahkan masalah kompleks.
Sebelumnya, hanya orang-orang yang paling mengamati perkembangan teknologi yang pernah mendengar tentang DeepSeek, perusahaan AI atau kecerdasan buatan dari China. Namun dalam beberapa hari terakhir, mereka bisa dibilang menjadi perusahaan yang paling banyak dibicarakan di Silicon Valley.
Tak cuma itu, DeepSeek-R1 juga memperoleh skor sama tinggi atau lebih tinggi dari o1 dari berbagai pihak ketiga, yang menggelar tes untuk mengukur kinerja AI dalam menjawab pertanyaan tentang berbagai subjek.
Dalam serangkaian uji dari pihak ketiga, DeepSeek mengungguli Llama 3.1 milik Meta, GPT-4o milik OpenAI, dan Claude Sonnet 3.5 milik Anthropic dalam hal akurasi, mulai dari pemecahan masalah yang rumit hingga matematika dan pengodean. DeepSeek juga merilis r1, model penalaran yang juga mengungguli o1 terbaru OpenAI dalam banyak pengujian pihak ketiga.
“Melihat model baru DeepSeek, sangat mengesankan dalam hal bagaimana mereka benar-benar efektif membuat model sumber terbuka dan sangat efisien dalam komputasi,” kata CEO Microsoft Satya Nadella di Forum Ekonomi Dunia di Davos, Swiss, pada hari Rabu.
DeepSeek harus mengatasi pembatasan semikonduktor ketat yang diberlakukan pemerintah AS terhadap China, yang memutus akses negara tersebut ke chip paling canggih, seperti H100 milik Nvidia. Kemajuan terbaru menunjukkan bahwa DeepSeek menemukan cara untuk mengakali aturan tersebut.
Sedikit yang diketahui tentang lab itu dan pendirinya, Liang WenFeng. Namun, DeepSeek bukan satu-satunya perusahaan China yang membuat terobosan.
Peneliti AI terkemuka Kai-Fu Lee mengatakan bahwa perusahaan rintisannya 01.ai dilatih hanya dengan menggunakan dana USD 3 juta. Perusahaan induk TikTok, ByteDance, juga merilis pembaruan untuk modelnya yang mengklaim mengungguli OpenAI dalam pengujian.
Teknologi AI China DeepSeek
Apa itu DeepSeek R1
DeepSeek R1 adalah model penalaran canggih yang dikembangkan oleh perusahaan rintisan AI China DeepSeek yang diluncurkan awal bulan ini.
Teknologi satu ini telah menarik perhatian besar karena kinerjanya yang luar biasa dan harga yang kompetitif.
DeepSeek R1 bertujuan untuk meningkatkan kemampuan penalaran dan analitis, memposisikannya sebagai pesaing tangguh bagi model AI terkemuka lainnya seperti OpenAI o1 dan ChatGPT.
DeepSeek R1 dibangun menggunakan arsitektur hibrida, mirip dengan pendahulunya, V3. Ya, ini bukan model pertama dari perusahaan rintisan China tersebut, tetapi lebih baik dalam hampir setiap aspek.
Model ini menggabungkan pembelajaran penguatan (RL) skala besar dan penalaran rantai pemikiran untuk meningkatkan ketepatan responsnya.
Model ini terdiri dari dua versi: DeepSeek-R1 dan DeepSeek-R1-Zero. Khususnya, versi terakhir mengalami penyempurnaan tanpa pengawasan, yang menunjukkan kemampuan penalaran yang luar biasa.
Asal Usul DeepSeek?
Jika dibanding OpenAI atau ChatGPT, teknologi AI DeepSeek sendiri masih merupakan entitas yang kurang dikenal.
Berkantor pusat di Hangzhou, China, perusahaan ini didirikan pada bulan Juli 2023 oleh Liang Wenfeng, lulusan Universitas Zhejiang yang mengkhususkan diri dalam bidang informasi dan teknik elektronik.
DeepSeek kemudian diinkubasi oleh High-Flyer, sebuah dana lindung nilai yang didirikan oleh Liang pada tahun 2015.
Mirip dengan Sam Altman dari OpenAI, tujuan Liang adalah untuk mengembangkan kecerdasan umum buatan (AGI) yakni AI tingkat lanjut yang mampu melakukan berbagai tugas pada atau di luar tingkat kemahiran manusia.
Bagaimana cara mendapatkan akses ke DeepSeek R1?
Pengguna dapat mengunjungi antarmuka DeepSeek Chat di chat.deepseek.com. Pendaftaran memerlukan alamat email yang valid, dan mengklik opsi “DeepThink” di beranda akan memberikan akses ke platform tersebut.
Bagi pengembang yang ingin mengintegrasikan DeepSeek-R1 ke dalam aplikasi mereka, akses API tersedia melalui Portal Pengembang DeepSeek.
Setelah memperoleh kunci API, pengembang dapat menyiapkan lingkungan mereka menggunakan alat seperti pustaka permintaan Python atau paket OpenAI. Klien API harus dikonfigurasi dengan URL dasar: api.deepseek.com.
Itulah pengertian DeepSeek R1 lengkap dengan berbagai informasi penting tentang “pesaing ChatGPT ini.
Teknologi AI China DeepSeek
Semoga bermanfaat!
Sumber : Teknologi AI China Deepseek