Pembaruan Terbaru dari OpenAI: Kecerdasan Buatan yang Bisa Bersaing dengan Ahli Manusia
OpenAI telah mengumumkan bahwa model kecerdasan buatan (AI) ChatGPT kini mampu menyaingi para ahli manusia di 44 profesi berbeda. Pengumuman ini dilakukan pada Selasa, bersamaan dengan peluncuran fitur baru yang memungkinkan pengguna membeli produk langsung dari Etsy dan Shopify tanpa meninggalkan antarmuka chat.
Model AI ini diklaim mampu melakukan tugas-tugas yang biasanya dilakukan oleh manusia dalam berbagai bidang pekerjaan. Untuk mengevaluasi kemampuan tersebut, OpenAI menciptakan tolok ukur baru bernama GDPval. Benchmark ini dirancang untuk menguji performa AI pada tugas-tugas pekerjaan nyata yang mencakup sembilan industri utama penyumbang Produk Domestik Bruto (PDB) Amerika Serikat.
Dalam evaluasi tersebut, model lain seperti Anthropic\’s Claude Opus 4.1 justru mencatat hasil lebih baik dibandingkan GPT-5 high milik OpenAI. Claude memperoleh tingkat kemenangan dan hasil imbang 47,6% melawan para profesional manusia, sementara GPT-5 high meraih 38,8%.
Evaluasi dengan Benchmark GDPval
GDPval dinilai sebagai kerangka kerja paling ambisius yang pernah dilakukan OpenAI untuk mengukur nilai ekonomi AI. Model diuji pada 1.320 hasil kerja otentik dari berbagai profesi, mulai dari pengembang perangkat lunak, pengacara, perawat, penasihat keuangan, hingga pekerja sosial.
Para profesional dengan rata-rata pengalaman 14 tahun dilibatkan untuk merancang tugas-tugas tersebut sekaligus bertindak sebagai penilai. Mereka membandingkan keluaran AI dengan hasil kerja manusia.
“Kami akhirnya memiliki cara untuk mengukur bagaimana model kami bekerja di dunia nyata — bukan hanya pada tes akademis — yang merupakan cara penting bagi kami untuk mengukur kemajuan menuju tujuan AGI,” ujar peneliti OpenAI, Tejal Patwardhan, kepada Axios.
Hasil pengujian menunjukkan peningkatan signifikan dari waktu ke waktu. GPT-4o yang dirilis pada musim semi 2024 hanya mencatat skor 13,7%. GPT-5 berhasil meningkatkan performa hampir tiga kali lipat.
OpenAI juga mengklaim bahwa model AI mereka mampu menyelesaikan tugas 100 kali lebih cepat dan 100 kali lebih murah dibandingkan para ahli manusia.
Fitur Instant Checkout: Pembelian Langsung dalam Chat
Selain laporan GDPval, OpenAI juga meluncurkan fitur \”Instant Checkout\” pada Senin. Fitur ini memungkinkan pengguna ChatGPT di Amerika Serikat membeli barang langsung di dalam percakapan.
Awalnya, fitur ini mendukung pembelian satu barang dari penjual Etsy. Selanjutnya, lebih dari satu juta merchant Shopify, termasuk Glossier, Skims, dan Spanx, akan segera bergabung.
Integrasi perdagangan ini menggunakan Agentic Commerce Protocol yang dikembangkan OpenAI bersama Stripe dan kini telah di-open source-kan untuk adopsi lebih luas.
Pengguna bisa mencari produk dengan kueri bahasa alami seperti “hadiah untuk pecinta keramik” lalu menyelesaikan pembelian menggunakan kartu kredit, Apple Pay, atau Google Pay, tanpa meninggalkan aplikasi ChatGPT.
Pengumuman ini memicu lonjakan harga saham. Etsy tercatat naik hampir 16% dan Shopify meningkat lebih dari 6% setelah fitur baru diumumkan.
OpenAI menegaskan biaya hanya dibebankan kepada merchant untuk setiap transaksi berhasil. Sementara itu, pengguna tidak dikenai biaya tambahan dan peringkat produk tidak dipengaruhi oleh status pembayaran.
Masa Depan AI di Dunia Kerja
Dengan adanya benchmark GDPval dan fitur Instant Checkout, OpenAI berusaha menunjukkan bahwa AI bisa benar-benar berguna di tempat kerja. GDPval disebut sebagai upaya untuk mendasari perdebatan soal AI di dunia kerja dengan bukti, bukan sekadar hype.
Dengan kemampuan yang semakin meningkat, AI kini tidak hanya menjadi alat bantu, tetapi juga bisa menjadi mitra kerja yang efisien dan hemat biaya. Dengan demikian, masa depan AI di berbagai industri tampak sangat menjanjikan.


Leave a Reply
You must be logged in to post a comment.