Startup AI Axiom selesaikan empat masalah matematika yang belum terpecahkan

Startup matematika AI baru bernama Axiom dilaporkan telah memecahkan empat masalah matematika lama yang sulit, menunjukkan kemajuan dalam penalaran kecerdasan buatan. AI perusahaan tersebut menangani tantangan di bidang seperti geometri aljabar dan teori bilangan yang membingungkan para matematikawan selama bertahun-tahun. Perkembangan ini menyoroti kemampuan AI yang semakin besar dalam mengatasi teka-teki akademik kompleks.

Dalam pengumuman baru-baru ini, Axiom, sebuah startup yang berfokus pada AI, mengklaim bahwa teknologinya telah menyelesaikan empat masalah matematika yang sebelumnya belum terpecahkan. Ini termasuk isu-isu dalam geometri aljabar, kalkulus, dan teori bilangan, bidang yang telah lama menantang para peneliti. Salah satu contoh spesifik melibatkan pekerjaan lima tahun lalu oleh matematikawan Dawei Chen dan Quentin Gendron. Mereka sedang mengeksplorasi area kompleks geometri aljabar yang menggabungkan diferensial—elemen kalkulus yang digunakan untuk mengukur jarak pada permukaan melengkung. Selama upaya mereka pada teorema tertentu, mereka menghadapi hambatan: bukti mereka bergantung pada rumus teori bilangan yang samar yang tidak dapat mereka pecahkan atau jelaskan. Akibatnya, Chen dan Gendron mempublikasikan temuan mereka sebagai konjektur daripada teorema lengkap. AI Axiom kini telah memberikan solusi untuk konjektur semacam itu, menunjukkan terobosan dalam penalaran otomatis untuk matematika murni. Pencapaian startup ini menunjukkan potensi AI untuk mempercepat penemuan di bidang teoretis, di mana intuisi manusia secara tradisional mendominasi. Namun, para ahli memperingatkan bahwa meskipun menjanjikan, bukti yang dihasilkan AI ini akan memerlukan verifikasi ketat oleh komunitas matematika untuk mengonfirmasi keabsahannya. Peristiwa ini menekankan persimpangan antara kecerdasan buatan dan akademisi, dengan implikasi bagi bagaimana penelitian masa depan mungkin mengintegrasikan bantuan mesin. Diterbitkan pada 4 Februari 2026, berita ini telah memicu minat di laboratorium AI yang mendorong batas-batas dalam disiplin STEM.

Artikel Terkait

Illustration of US Treasury Secretary warning bank executives about AI cyberattack risks from Anthropic's Claude Mythos.
Gambar dihasilkan oleh AI

US Treasury warns banks of AI cyberattack risks following Anthropic's Claude Mythos announcement

Dilaporkan oleh AI Gambar dihasilkan oleh AI

In the wake of Anthropic's unveiling of its powerful Claude Mythos AI—capable of detecting and exploiting software vulnerabilities—the US Treasury Secretary has convened top bank executives to highlight escalating AI-driven cyber threats. The move underscores growing concerns as the AI is restricted to a tech coalition via Project Glasswing.

Pada American Physical Society Global Physics Summit di Denver, Colorado, ribuan peneliti menggunakan chatbot AI untuk menyederhanakan diskusi yang kompleks. Acara ini memicu diskusi intens mengenai apakah kecerdasan buatan akan mengubah penelitian fisika. Para pembicara memaparkan pandangan yang kontras mengenai potensi dan keterbatasan AI.

Dilaporkan oleh AI

Institut Keamanan AI pemerintah Inggris telah merilis evaluasi terhadap model AI Mythos Preview dari Anthropic, yang mengonfirmasi kinerja kuatnya dalam tantangan infiltrasi siber bertahap. Mythos menjadi model pertama yang berhasil menyelesaikan simulasi serangan jaringan 32 langkah yang menantang, yang dikenal sebagai 'The Last Ones'. Institut tersebut memperingatkan bahwa pertahanan di dunia nyata dapat membatasi ancaman otomatis semacam itu.

Para ahli berpendapat bahwa AI fisik, yang melibatkan robot dan mesin otonom berinteraksi dengan dunia nyata, mungkin menyediakan jalur langsung menuju kecerdasan buatan umum. Komentar Elon Musk mengenai robot Optimus milik Tesla menyoroti potensi ini, di tengah investasi yang semakin meningkat dalam teknologi terkait. Tahun 2026 dipandang sebagai titik infleksi kunci bagi bidang ini.

Dilaporkan oleh AI

Analisis New York Times menunjukkan bahwa AI Overviews Google, yang ditenagai oleh Gemini, hanya menjawab pertanyaan dengan benar sebesar 90% hingga 91% dalam tolok ukur standar. Hal ini setara dengan puluhan juta jawaban yang salah setiap harinya dalam penelusuran. Google membantah relevansi pengujian tersebut.

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak