Asisten pengodean AI teratas gagal dalam satu dari empat tugas

Minggu, 22 Maret 2026

Dilaporkan oleh AI

Asisten pengodean AI terkemuka gagal dalam satu dari empat tugas, menurut analisis TechRadar. Laporan tersebut menunjukkan kesenjangan serius antara sensasi dan keandalan kinerja yang sebenarnya, terutama dalam tugas output terstruktur. Alat AI masih jauh dari sempurna di bidang-bidang penting ini.

Artikel TechRadar yang diterbitkan pada 22 Maret 2026, menguji kinerja asisten pengodean AI teratas. Laporan tersebut mengungkapkan bahwa alat-alat ini gagal dalam satu dari empat tugas, menyoroti perbedaan signifikan antara klaim promosi dan keandalan di dunia nyata. Analisis ini berfokus pada tugas output terstruktur, di mana asisten AI menunjukkan kekurangan yang nyata, yang digambarkan jauh dari sempurna. Hal ini menimbulkan pertanyaan tentang efektivitasnya dalam lingkungan pengodean profesional. Judul artikel tersebut menggarisbawahi 'kesenjangan serius antara sensasi dan keandalan kinerja yang sebenarnya.' Tidak ada model atau metodologi spesifik yang dirinci dalam kutipan yang tersedia, namun temuan tersebut menyarankan kehati-hatian dalam mengandalkan alat semacam itu untuk pekerjaan yang kritis.

Artikel Terkait

Study finds heavy AI use at work lowers confidence

A new study published this month by the American Psychological Association reveals that heavy reliance on AI tools for workplace tasks correlates with reduced confidence in personal abilities and less sense of ownership over work. Researchers observed that users who rarely modify AI outputs feel less confident in their independent reasoning. The findings highlight trade-offs between speed and depth in AI-assisted work.

Study finds Google's AI Overviews wrong in 10% of cases

Rabu, 08 April 2026 Dilaporkan oleh AI

A New York Times analysis shows Google's AI Overviews, powered by Gemini, answering correctly only 90% to 91% of questions in a standard benchmark. This translates to tens of millions of incorrect responses daily across searches. Google disputes the test's relevance.

Teknologi

Vogue survey shows low trust in AI for fashion shopping

Kesehatan

Generative AI outperforms human teams in analyzing medical data

Teknologi

Microsoft AI chief predicts AI replacement of white-collar jobs

Linux maintainer says AI tools now find real bugs

Greg Kroah-Hartman, maintainer of the Linux kernel, stated that AI-driven code review tools have become genuinely useful. He told The Register that the technology reached an inflection point about a month ago, leading to actionable bug reports.

Report critiques big tech's unsubstantiated AI climate claims

Rabu, 18 Februari 2026 Dilaporkan oleh AI

A recent report examines claims by big tech companies that generative AI can help combat climate change, finding limited evidence to support them. Of 154 specific assertions, only a quarter referenced academic research, while a third offered no proof at all. The analysis highlights Google's 2023 claim of AI reducing global emissions by 5 to 10 percent by 2030 as an example.

Tesla