Pembelajaran Mesin
DeepSeek menguji perhatian jarang untuk mengurangi biaya AI
Rabu, 01 Oktober 2025 Dilaporkan oleh AI
Perusahaan AI China DeepSeek sedang bereksperimen dengan mekanisme perhatian jarang untuk secara signifikan menurunkan biaya pemrosesan model bahasa besar. Pendekatan ini memfokuskan komputasi pada bagian kunci data masukan, berpotensi memotong setengah kebutuhan sumber daya. Perkembangan ini dapat membuat AI canggih lebih mudah diakses di tengah kekhawatiran energi yang meningkat.
Anthropic meluncurkan model AI Claude Sonnet 4.5
Selasa, 30 September 2025 Dilaporkan oleh AI
Anthropic telah merilis model AI terbarunya, Claude Sonnet 4.5, yang diklaim unggul dalam aplikasi dunia nyata. Model ini menunjukkan fokus berkelanjutan hingga 30 jam pada tugas kompleks bertahap ganda. Benchmark independen, termasuk satu dari OpenAI, menunjukkan bahwa ia mengungguli rival di skenario pekerjaan praktis.
Thinking Machines Lab meluncurkan produk AI pertama Fine-Tune
Kamis, 02 Oktober 2025 Dilaporkan oleh AI
Thinking Machines Lab, sebuah startup yang didirikan oleh mantan peneliti OpenAI, telah meluncurkan produk perdananya, Fine-Tune, yang bertujuan untuk menyederhanakan penyesuaian model bahasa besar. Platform ini menjanjikan untuk membuat fine-tuning dapat diakses oleh pengembang tanpa sumber daya yang luas. Peluncuran ini menandai langkah penting bagi perusahaan di pasar alat AI yang kompetitif.