Asisten pengodean AI teratas gagal dalam satu dari empat tugas

Asisten pengodean AI terkemuka gagal dalam satu dari empat tugas, menurut analisis TechRadar. Laporan tersebut menunjukkan kesenjangan serius antara sensasi dan keandalan kinerja yang sebenarnya, terutama dalam tugas output terstruktur. Alat AI masih jauh dari sempurna di bidang-bidang penting ini.

Artikel TechRadar yang diterbitkan pada 22 Maret 2026, menguji kinerja asisten pengodean AI teratas. Laporan tersebut mengungkapkan bahwa alat-alat ini gagal dalam satu dari empat tugas, menyoroti perbedaan signifikan antara klaim promosi dan keandalan di dunia nyata. Analisis ini berfokus pada tugas output terstruktur, di mana asisten AI menunjukkan kekurangan yang nyata, yang digambarkan jauh dari sempurna. Hal ini menimbulkan pertanyaan tentang efektivitasnya dalam lingkungan pengodean profesional. Judul artikel tersebut menggarisbawahi 'kesenjangan serius antara sensasi dan keandalan kinerja yang sebenarnya.' Tidak ada model atau metodologi spesifik yang dirinci dalam kutipan yang tersedia, namun temuan tersebut menyarankan kehati-hatian dalam mengandalkan alat semacam itu untuk pekerjaan yang kritis.

Artikel Terkait

A new study published this month by the American Psychological Association reveals that heavy reliance on AI tools for workplace tasks correlates with reduced confidence in personal abilities and less sense of ownership over work. Researchers observed that users who rarely modify AI outputs feel less confident in their independent reasoning. The findings highlight trade-offs between speed and depth in AI-assisted work.

Dilaporkan oleh AI

A New York Times analysis shows Google's AI Overviews, powered by Gemini, answering correctly only 90% to 91% of questions in a standard benchmark. This translates to tens of millions of incorrect responses daily across searches. Google disputes the test's relevance.

Greg Kroah-Hartman, maintainer of the Linux kernel, stated that AI-driven code review tools have become genuinely useful. He told The Register that the technology reached an inflection point about a month ago, leading to actionable bug reports.

Dilaporkan oleh AI

A recent report examines claims by big tech companies that generative AI can help combat climate change, finding limited evidence to support them. Of 154 specific assertions, only a quarter referenced academic research, while a third offered no proof at all. The analysis highlights Google's 2023 claim of AI reducing global emissions by 5 to 10 percent by 2030 as an example.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak