Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan berita terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut


Google terbuka Gemini 2.0 hari ini menandai lompatan ambisius menuju sistem kecerdasan buatan yang dapat melakukan tugas-tugas kompleks secara mandiri, memperkenalkan kemampuan pembuatan video asli dan audio multibahasa yang memungkinkan raksasa teknologi tersebut bersaing secara langsung dengan OpenAI Dan Antropis dalam perlombaan yang semakin memanas untuk mendapatkan dominasi AI.

Rilis ini dilakukan hampir setahun setelah Google. peluncuran awal Geminimuncul pada momen penting dalam pengembangan kecerdasan buatan. Daripada sekadar merespons pertanyaan, sistem AI “agen” baru ini dapat memahami berbagai konteks, merencanakan beberapa langkah ke depan, dan mengambil tindakan yang diawasi atas nama pengguna.

Bagaimana asisten AI baru Google dapat mengubah kehidupan digital sehari-hari

Pada konferensi pers baru-baru ini, Tulsee Doshi, direktur manajemen produk Gemini, menguraikan peningkatan kemampuan sistem, menunjukkan pembuatan gambar real-time dan obrolan multi-bahasa. “Gemini 2.0 menghadirkan peningkatan performa dan kemampuan baru seperti native imaging dan generasi audio multibahasa,” jelas Doshi. “Ia juga menggunakan alat pintar, yang berarti dapat langsung mengakses produk Google, seperti pencarian, atau bahkan mengeksekusi kode.”

Rilis awal terkonsentrasi Gemini 2.0 Flashversi eksperimental yang, menurut Google, bekerja dua kali lebih cepat dari pendahulunya, sekaligus melampaui kemampuan model yang lebih bertenaga. Ini merupakan pencapaian teknis yang signifikan, karena peningkatan kecepatan sebelumnya umumnya mengorbankan fungsionalitas.

Agen AI generasi berikutnya yang berjanji untuk mengubah cara kita bekerja

Mungkin yang paling penting, Google meluncurkan tiga prototipe agen AI yang dibangun berdasarkan arsitektur Gemini 2.0 yang menunjukkan visi perusahaan untuk masa depan AI. Proyek Astraasisten AI universal yang diperbarui, menunjukkan kemampuannya untuk mendukung percakapan kompleks dalam berbagai bahasa, sekaligus mengakses alat Google dan mempertahankan memori kontekstual dari interaksi sebelumnya.

“Project Astra kini memiliki memori sesi hingga 10 menit dan dapat mengingat percakapan Anda sebelumnya, sehingga Anda dapat memperoleh pengalaman yang lebih berguna dan dipersonalisasi,” jelas Bibo Xu, Manajer Produk Grup Google. DeepMind selama demo langsung. Sistem ini bertransisi dengan lancar dari satu bahasa ke bahasa lain dan mengakses informasi secara real-time melalui Google Penelusuran dan Maps, menunjukkan tingkat integrasi yang belum pernah terlihat pada produk AI konsumen.

Google diperkenalkan kepada pengembang dan pelanggan bisnis Proyek Pelaut Dan Julesdua agen AI khusus untuk mengotomatiskan tugas teknis yang kompleks. Didemonstrasikan sebagai ekstensi Chrome, Project Mariner mencapai tingkat keberhasilan yang mengesankan sebesar 83,5% pada tolok ukur WebVoyager untuk tugas-tugas web dunia nyata, suatu peningkatan yang signifikan dibandingkan pengujian penjelajahan web otonom sebelumnya.

“Project Mariner adalah prototipe penelitian awal yang mengeksplorasi kemampuan agen untuk menavigasi web dan mengambil tindakan,” kata Jaclyn Konzelmann, direktur manajemen produk di Google Labs. “Saat dinilai oleh Tolok ukur WebVoyageryang menguji kinerja agen pada semua tugas web dunia nyata, Project Mariner memperoleh skor mengesankan sebesar 83,5%.

Silikon khusus dan skala besar: Infrastruktur untuk ambisi AI Google

Mendukung kemajuan ini adalah TriliumTensor Processing Unit (TPU) generasi keenam Google, yang sudah menjadi hal biasa tersedia di awan pelanggan Hari ini. Akselerator AI khusus mewakili investasi besar dalam infrastruktur komputasi, dengan Google menerapkan lebih dari 100.000 chip Trillium pada satu jaringan.

Logan Kilpatrick, manajer produk AI Studio dan tim API Gemini, menyoroti dampak praktis dari investasi infrastruktur ini pada konferensi pers. “Penggunaan flash meningkat lebih dari 900%, dan ini luar biasa,” kata Kilpatrick. “Anda tahu, dengan enam model eksperimental yang diluncurkan dalam beberapa bulan terakhir, kini ada jutaan pengembang yang menggunakan Gemini.”

Jalan ke Depan: Masalah Keamanan dan Persaingan di Era AI Otonom

Peralihan Google ke agen otonom mungkin merupakan perubahan strategis paling penting dalam kecerdasan buatan sejak OpenAI dirilis ObrolanGPT. Meskipun para pesaing berfokus pada peningkatan kemampuan model bahasa besar, Google bertaruh bahwa masa depan adalah milik sistem AI yang dapat secara aktif menavigasi lingkungan digital dan melakukan tugas-tugas kompleks dengan sedikit campur tangan manusia.

Visi agen AI yang mampu berpikir, merencanakan, dan bertindak menandai penyimpangan dari paradigma asisten AI reaktif saat ini. Ini merupakan taruhan yang berisiko—sistem otonom pada dasarnya menimbulkan masalah keselamatan dan tantangan teknis yang lebih besar, namun jika berhasil, dapat mengubah lanskap persaingan. Investasi besar perusahaan di silikon khusus Dan infrastruktur menunjukkan bahwa pihaknya siap bersaing secara agresif ke arah baru ini.

Tapi beralih ke lebih banyak lagi AI otonom sistem menimbulkan masalah keselamatan dan etika baru. Google telah menekankan komitmennya terhadap pengembangan yang bertanggung jawab, termasuk pengujian ekstensif dengan pengguna tepercaya dan langkah-langkah keamanan bawaan. Pendekatan perusahaan untuk meluncurkan fitur-fitur ini secara bertahap, dimulai dengan akses pengembang dan penguji tepercaya, menunjukkan bahwa perusahaan perlu menyadari potensi risiko yang terkait dengan penerapan sistem AI otonom.

Peluncuran ini dilakukan pada saat yang penting bagi Google karena menghadapi tekanan yang semakin besar dari para pesaing dan peningkatan pengawasan terhadap keamanan AI. Microsoft Dan OpenAI telah membuat kemajuan besar dalam kecerdasan buatan tahun ini, dan perusahaan lain juga mengikuti langkah yang sama Antropis mendapatkan daya tarik di kalangan pelanggan bisnis.

“Kami sangat yakin bahwa satu-satunya cara untuk membangun kecerdasan buatan adalah dengan bertanggung jawab sejak awal,” Shrestha Basu Mallick, Manajer Produk Grup API di Gemini, menekankan pada konferensi pers. “Saat kami mengembangkan model dan agen kami, kami akan terus memprioritaskan keselamatan dan akuntabilitas sebagai inti dari proses pengembangan model.”

Ketika sistem ini menjadi lebih mampu beroperasi di dunia nyata, mereka dapat mengubah cara orang berinteraksi dengan teknologi secara mendasar. Keberhasilan Gemini 2.0 tidak hanya menentukan posisi Google di pasar AI, tetapi juga arah pengembangan AI yang lebih luas seiring dengan pergerakan industri menuju sistem yang lebih otonom.

Setahun yang lalu, ketika Google merilis versi pertama Gemini, lanskap AI didominasi oleh chatbot yang dapat melakukan percakapan cerdas tetapi kesulitan dengan tugas-tugas dunia nyata. Kini setelah agen kecerdasan buatan mulai mengambil langkah tentatif pertama menuju otonomi, industri ini berada pada titik balik lainnya. Pertanyaannya bukan lagi apakah AI dapat memahami kita, namun apakah kita siap membiarkan AI bertindak atas nama kita. Google yakin kita memang benar – dan memang demikian.


Source link