Nvidia telah merilis model kecerdasan buatan sumber terbuka yang kuat yang dapat mengungguli GPT-4 OpenAI.
Rangkaian model bahasa multimodal (LLM) besar NVLM 1.0 baru dari perusahaan ini memiliki hampir 72 miliar parameter dengan model andalan NVLM-D-72B.
Menurut tim peneliti Nvidia, model AI baru ini unggul dalam tugas-tugas bahasa penglihatan dan mempertahankan dan bahkan meningkatkan kinerja hanya teks dibandingkan dengan model LLM-nya. Di dalamnya kertasPara peneliti menyatakan: “Kami menghadirkan NVLM 1.0, rangkaian model bahasa multimodal skala besar tingkat batas yang mencapai hasil tercanggih dalam tugas bahasa penglihatan, dengan model kepemilikan terkemuka (misalnya, GPT-4o) dan terbuka model sumber.”
Berbeda dengan beberapa model berpemilik lainnya yang mengalami penurunan kinerja teks secara signifikan dari waktu ke waktu, NVLM-D-72B meningkatkan akurasinya rata-rata sebesar 4,3 poin di seluruh metrik teks utama.
LLM juga mampu menafsirkan grafik dan tabel, menganalisis gambar, memahami meme, membuat kode perangkat lunak, serta memecahkan masalah matematika. Bobot model tersedia di Hugging Face, dan Nvidia mengatakan pada akhirnya akan merilis kode pelatihan.
Apa pendapat komunitas AI tentang model NVLM Nvidia
Peneliti AI di X menyebut rilis ini “liar” dan memuji kemampuannya dalam memahami data visual. Seorang pengguna menulis: “Wow! Nvidia baru saja merilis model 72B yang setara dengan llama 3.1 405B dalam matematika dan coding dan juga memiliki visi? “
NVLM didukung oleh NVIDIA. Dan buka. Coba lihat. pic.twitter.com/r9V8uamGVf
— Alex Zhavoronkov, MD (alias Alexander Zavoronkov) (@biogerentology) 2 Oktober 2024
Wow. Model 72B baru NVIDIA menyaingi Llama 405B! pic.twitter.com/TUZ378S4tz
— Jeremy Howard (@jeremyphoward) 1 Oktober 2024
Wow nvidia baru saja merilis model 72B yang setara dengan llama 3.1 405B dalam matematika dan coding dan juga memiliki visi. pic.twitter.com/c46DeXql7s
— Phil (@philll__1) 1 Oktober 2024
Nvidia sendiri disebut-sebut telah menggunakan open source untuk mengembangkan NVLM 1.0, mengambil wawasan dari model AI lain dan berbagai data pelatihan. Namun, model NVLM-D-72B dibatasi oleh ketentuan lisensinya. Ini tidak boleh digunakan untuk tujuan komersial atau dimodifikasi untuk dijual. Pada dasarnya, Nvidia menawarkan model ini hanya untuk tujuan penelitian dan untuk penghobi yang ingin menguji batas kartu grafis kelas atas mereka.
Oleh karena itu, penggunaan istilah “terbuka” oleh peneliti sangat disengaja. Meskipun temuan Nvidia memberikan nilai, pembatasan penggunaan komersial berarti bahwa model tersebut tidak dapat dianggap benar-benar open source, sehingga memerlukan kebebasan untuk menggunakan, memodifikasi, dan mendistribusikan model tanpa batasan.
ReadWrite telah menghubungi Nvidia untuk memberikan komentar.
Gambar Unggulan: Pertengahan Perjalanan
Pos Nvidia memperkenalkan model AI NVLM 1.0 barunya untuk bersaing dengan OpenAI GPT-4 muncul pertama kali di ReadWrite.