Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan berita terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut


Nvidia Dan DataStax hari ini memperkenalkan teknologi baru yang secara signifikan mengurangi kebutuhan penyimpanan bagi perusahaan yang menerapkan sistem AI generatif dan memungkinkan akses informasi dalam berbagai bahasa lebih cepat dan akurat.

Yang baru Layanan Mikro Nvidia NeMo Retrieverterintegrasi dengan Platform AI DataStaxMengurangi penyimpanan data hingga 35x dibandingkan metode tradisional, sebuah kemampuan penting yang diharapkan dapat dicapai oleh data perusahaan lebih dari 20 zettabyte pada tahun 2027.

“Saat ini, perusahaan memiliki 11 zettabytes data tidak terstruktur, sekitar 800.000 salinan Library of Congress, 83% di antaranya tidak terstruktur dan 50% di antaranya adalah audio dan video,” kata Kari Briski, wakil presiden manajemen produk kecerdasan buatan Nvidia. . dalam sebuah wawancara dengan VentureBeat. “Mengurangi biaya penyimpanan secara signifikan sekaligus memungkinkan perusahaan untuk menyematkan dan mengambil informasi secara efisien adalah sebuah terobosan.”

Teknologi Nvidia NeMo Retriever memberikan efisiensi penyimpanan data 35x lebih baik, seperti yang ditunjukkan dengan membandingkan penyimpanan teks mentah, penyematan vektor dasar, dan pengurangan dimensi penyematan. Terobosan ini memperkuat skalabilitas AI generatif di seluruh aplikasi perusahaan. (Kredit: Nvidia)

Teknologi ini telah terbukti transformatif Yayasan Wikimediayang menggunakan solusi terintegrasi untuk mengurangi waktu pemrosesan 10 juta entri Wikipedia dari 30 hari menjadi kurang dari tiga hari. Sistem ini menangani pembaruan real-time dari ratusan ribu postingan yang diedit setiap hari oleh 24.000 sukarelawan di seluruh dunia.

“Anda tidak bisa hanya mengandalkan pola bahasa besar untuk konten — Anda memerlukan konteks dari data perusahaan yang ada,” jelas Chet Kapoor, CEO DataStax. “Di situlah kemampuan pencarian hibrid kami berperan, menggabungkan pencarian teks semantik dan tradisional dan kemudian menggunakan teknologi pemeringkatan ulang Nvidia untuk memberikan hasil teratas secara global dan real-time.”

Keamanan data perusahaan memenuhi aksesibilitas AI

Kemitraan ini mengatasi tantangan besar yang dihadapi perusahaan: bagaimana membuat penyimpanan data pribadi mereka yang besar dapat diakses oleh sistem AI tanpa memaparkan informasi sensitif ke model bahasa eksternal.

“Misalnya FedEx, 60% data mereka ada di produk kami, termasuk semua informasi pengiriman selama 20 tahun terakhir dengan informasi pribadi. “Gemini atau OpenAI tidak akan mencapainya dalam waktu dekat,” jelas Kapoor.

Teknologi ini adalah yang pertama kali diadopsi di berbagai industri, dengan perusahaan jasa keuangan yang memimpin meskipun ada kendala peraturan. “Saya terkejut dengan seberapa jauh perkembangan perusahaan jasa keuangan saat ini,” kata Kapoor. Bank Persemakmuran Australia Dan Modal pertama sebagai contoh.

Perbatasan AI berikutnya: pemrosesan dokumen multimodal

Ke depan, Nvidia berencana memperluas kemampuan teknologinya untuk menangani format dokumen yang lebih kompleks. “Kami melihat hasil yang luar biasa ketika kami memproses PDF multi-format—memahami tabel, bagan, grafik, dan gambar serta hubungannya antar halaman,” ungkap Briski. “Ini adalah masalah yang sangat sulit yang kami tunggu untuk dipecahkan.”

Bagi perusahaan yang tenggelam dalam data tidak terstruktur dan mencoba menerapkan AI secara bertanggung jawab, penawaran baru ini memberikan peluang untuk mempersiapkan sumber daya informasi mereka untuk AI tanpa mengorbankan biaya keamanan atau penyimpanan. Solusinya segera tersedia melalui Direktori API Nvidia dengan lisensi uji coba gratis 90 hari.

Laporan ini menyoroti semakin besarnya fokus pada infrastruktur AI perusahaan seiring dengan peralihan perusahaan dari eksperimen ke penerapan skala besar, dengan manajemen data dan efisiensi biaya menjadi faktor keberhasilan utama.


Source link