Performa GPT-5 Menurun? OpenAI Kembalikan GPT-4o untuk Pengguna?

Performa GPT-5 Menurun? OpenAI Kembalikan GPT-4o untuk Pengguna?

Peluncuran setiap versi terbaru dari model kecerdasan buatan (AI) selalu menjadi momen yang dinanti-nantikan, khususnya dari raksasa teknologi seperti OpenAI. Setelah GPT-4 dan versi multimodalnya GPT-4o berhasil memukau dunia, ekspektasi terhadap GPT-5 sangatlah tinggi. Namun baru-baru ini sebuah narasi yang beredar di kalangan pengguna menimbulkan keraguan besar: apakah performa GPT-5 menurun dibandingkan pendahulunya? Isu ini semakin memanas ketika CEO OpenAI, Sam Altman menanggapi langsung keluhan yang membanjiri forum dan media sosial, mengisyaratkan kemungkinan untuk mengembalikan GPT-4o bagi para pelanggan. Artikel ini akan mengupas tuntas isu tersebut, membedah klaim OpenAI, dan menyajikan perspektif pengguna yang merasakan adanya penurunan kinerja.


Performa GPT-5 Menurun? OpenAI Kembalikan GPT-4o untuk Pengguna?

Klaim Ambisius OpenAI versus Pengalaman Pengguna yang Berbeda

Saat GPT-5 diluncurkan, OpenAI memasarkannya sebagai “model paling cerdas, paling cepat, dan paling berguna” yang pernah mereka ciptakan. Klaim ini didasarkan pada peningkatan signifikan dalam kemampuan penalaran (reasoning), pemecahan masalah kompleks, serta kemampuan untuk menghasilkan kode dan tulisan yang lebih akurat dan profesional. Sam Altman bahkan membandingkan pengalaman menggunakan GPT-5 dengan memiliki “tim ahli setingkat Ph.D. di saku Anda.”

Namun di sisi lain, pengalaman pengguna sehari-hari tampaknya menceritakan kisah yang berbeda. Ribuan pengguna ChatGPT terutama yang berlangganan layanan premium, mulai melaporkan adanya penurunan kualitas output secara substansial. Mereka mengeluhkan bahwa GPT-5 terasa kurang kreatif, cenderung memberikan jawaban yang lebih panjang dan bertele-tele, dan bahkan sering kali mengabaikan instruksi yang spesifik dari pengguna. Beberapa pengguna yang mengandalkan AI untuk tugas-tugas kreatif seperti menulis cerita atau membuat lirik, merasa bahwa hasil dari GPT-5 terasa “hambar” atau kurang bervariasi dibandingkan GPT-4o.

Keluhan ini tidak hanya datang dari pengguna kasual, tetapi juga dari komunitas pengembang dan profesional yang mengandalkan AI untuk pekerjaan kritis. Para coder mencatat bahwa kode yang dihasilkan oleh GPT-5 terkadang kurang optimal atau memerlukan lebih banyak debugging dibandingkan GPT-4o. Hal ini menciptakan perpecahan yang mencolok antara narasi resmi perusahaan dan realita yang dirasakan oleh basis penggunanya. Seolah-olah apa yang diklaim sebagai kemajuan di atas kertas, justru tidak selaras dengan ekspektasi dan kebutuhan para pengguna di lapangan.


Analisis Mendalam Mengapa Performa GPT-5 Menurun?

Fenomena performa GPT-5 menurun ini memicu banyak spekulasi dan analisis dari komunitas teknologi. Ada beberapa teori yang coba menjelaskan mengapa model AI yang seharusnya lebih maju ini justru terasa kurang mumpuni bagi sebagian pengguna.

  1. Pertama, kemungkinan besar ada perubahan dalam tuning atau penyesuaian model. Setiap model AI besar dilatih dengan data yang sangat masif, dan kemudian diatur sedemikian rupa untuk menghasilkan respons yang aman, bermanfaat, dan tidak ofensif. Proses ini dikenal sebagai alignment. Ada dugaan bahwa dalam upaya membuat GPT-5 lebih “aman” dan mengurangi “halusinasi” atau kesalahan, OpenAI mungkin telah membuat model ini menjadi terlalu hati-hati, sehingga menghilangkan sebagian dari kreativitas dan spontanitas yang ada pada GPT-4o. Respons yang lebih panjang dan monoton bisa jadi merupakan hasil dari algoritma yang diprogram untuk menghindari risiko kesalahan.
  2. Kedua, perbedaan user-interface dan pengalaman pengguna juga bisa menjadi faktor. OpenAI mungkin telah mengubah cara model berinteraksi dengan pengguna, yang membuat mereka harus menyesuaikan kembali cara mereka memberikan prompt. Sebuah model yang sangat cerdas belum tentu mudah digunakan jika antarmuka dan interaksinya tidak intuitif. Pengguna mungkin merasa frustrasi karena cara lama mereka berinteraksi dengan GPT-4o tidak lagi memberikan hasil yang sama baiknya dengan GPT-5.
  3. Ketiga, ada kemungkinan bahwa perbedaan performa ini lebih bersifat persepsional. Pengguna cenderung membandingkan model baru dengan pengalaman terbaik yang mereka miliki dengan model lama. Apabila GPT-4o terkadang memberikan hasil yang luar biasa, sementara GPT-5 memberikan hasil yang konsisten tapi kurang spektakuler, persepsi yang terbentuk bisa jadi adalah performa GPT-5 menurun. Hal ini bisa diperparah oleh fenomena psikologis di mana kita cenderung lebih mengingat pengalaman negatif atau yang tidak memenuhi ekspektasi.

Tanggapan OpenAI: Performa GPT-5 Menurun dan Kemungkinan Mengembalikan GPT-4o

Performa GPT-5 Menurun? OpenAI Kembalikan GPT-4o untuk Pengguna?

Keluhan yang semakin gencar tidak luput dari perhatian Sam Altman. Ia menanggapi langsung masalah ini dengan mengakui bahwa mereka sedang mempertimbangkan untuk memberikan opsi bagi pengguna ChatGPT Plus agar dapat kembali menggunakan GPT-4o. Tanggapan ini, meskipun belum menjadi janji pasti, sudah cukup untuk meredakan sebagian kegelisahan pengguna.

Langkah ini menunjukkan bahwa OpenAI sangat peka terhadap umpan balik dari komunitas pengguna. Namun di balik itu, keputusan ini juga menimbulkan pertanyaan strategis. Apakah ini merupakan pengakuan terselubung bahwa GPT-5 memang tidak memenuhi ekspektasi di beberapa area? Atau apakah ini hanya langkah sementara untuk menenangkan pengguna sambil tim pengembang melakukan penyesuaian dan perbaikan pada GPT-5? Jika OpenAI benar-benar mengembalikan GPT-4o sebagai opsi, hal itu bisa diartikan bahwa mereka menyadari bahwa tidak semua pengguna membutuhkan atau menginginkan model yang “paling cerdas” jika itu mengorbankan aspek lain seperti kreativitas dan kemudahan penggunaan.

Ini juga bisa menjadi pelajaran penting bagi industri AI secara keseluruhan. Pengembangan model AI tidak hanya tentang membuat model yang lebih besar atau lebih kuat, tetapi juga tentang bagaimana model tersebut benar-benar dapat memenuhi kebutuhan dan harapan beragam dari penggunanya. Keputusan untuk mengembalikan model lama bisa menjadi preseden bahwa inovasi tidak selalu harus berarti menghapus sepenuhnya apa yang sudah berhasil. Terkadang, memberi pilihan kepada pengguna adalah strategi yang lebih bijak.


Perbandingan Kritis: GPT-5 vs. GPT-4o

Untuk memahami secara lebih objektif isu performa GPT-5 menurun, kita dapat melihat perbandingan kritis antara kedua model ini dari sudut pandang pengguna, bukan hanya klaim teknis.

  • Kualitas Jawaban: GPT-4o dikenal karena kemampuannya menghasilkan jawaban yang ringkas, kreatif, dan seringkali memiliki “kepribadian.” Sebaliknya, GPT-5, meskipun secara teknis lebih akurat dalam tugas-tugas faktual, sering kali dianggap kurang bervariasi dan cenderung memberikan respons yang lebih generik.
  • Kecepatan dan Efisiensi: GPT-5 diklaim lebih cepat, namun hal ini tidak selalu terasa oleh pengguna. Untuk tugas-tugas sederhana, perbedaannya mungkin tidak signifikan. Sementara untuk tugas yang lebih kompleks, respons yang lebih panjang dari GPT-5 bisa membuat proses terasa lebih lambat secara keseluruhan.
  • Pengkodean: Meskipun OpenAI mempromosikan GPT-5 sebagai alat coding yang lebih mumpuni, beberapa pengembang menemukan bahwa GPT-4o terkadang menghasilkan kode yang lebih efisien dan siap pakai.
  • Kemudahan Penggunaan: GPT-4o, dengan tuning yang lebih “longgar,” memungkinkan pengguna untuk lebih mudah mendapatkan hasil yang mereka inginkan dengan prompt yang sederhana. GPT-5, dengan fokus pada presisi dan keamanan, mungkin memerlukan prompt yang lebih detail dan spesifik untuk menghindari hasil yang terlalu kaku.

Perbandingan ini menegaskan bahwa “lebih canggih” tidak selalu berarti “lebih baik” di mata pengguna. Pengguna tidak hanya mencari model yang paling cerdas, tetapi juga model yang paling sesuai dengan kebutuhan mereka. Bagi banyak orang, kreativitas dan fleksibilitas GPT-4o mungkin lebih berharga daripada akurasi teknis yang diklaim oleh GPT-5.


Perspektif Pakar dan Implikasi Jangka Panjang Mengenai Performa GPT-5 Menurun

Isu ini juga menarik perhatian para pakar dan kritikus AI. Prof. Carissa Véliz, seorang pakar etika AI yang berpendapat bahwa promosi GPT-5 mungkin lebih bersifat marketing daripada fakta. Ia menegaskan bahwa model AI hanya mampu meniru, bukan benar-benar memiliki kemampuan penalaran manusia. Pandangan ini mengingatkan kita untuk tetap kritis terhadap klaim-klaim yang terlalu bombastis dari perusahaan teknologi.

Gaia Marcus, Direktur Ada Lovelace Institute, menyoroti bahwa semakin canggihnya model AI seperti GPT-5, semakin mendesak pula kebutuhan akan regulasi yang komprehensif. Perdebatan mengenai performa GPT-5 menurun ini bukan hanya tentang kualitas sebuah produk, tetapi juga tentang implikasi yang lebih luas, termasuk bagaimana data digunakan untuk melatih model dan perlunya transparansi dari perusahaan AI.

Secara jangka panjang, episode ini bisa menjadi titik balik bagi industri AI. Perusahaan mungkin akan mulai menyadari bahwa mereka tidak bisa hanya mengejar “kecerdasan” tanpa memperhatikan pengalaman pengguna. Ada keseimbangan yang rumit antara akurasi, kreativitas, dan keamanan yang harus mereka temukan. Masa depan AI mungkin akan lebih berpusat pada personalisasi dan pilihan, di mana pengguna dapat memilih model yang paling sesuai dengan preferensi mereka, bukan hanya menerima satu model “terbaik” yang dipaksakan.


Pada akhirnya, pertanyaan “Performa GPT-5 Menurun?” tidak bisa dijawab dengan jawaban tunggal. Bagi sebagian pengguna, terutama yang mengandalkan AI untuk tugas-tugas faktual dan presisi, GPT-5 mungkin memang terasa lebih unggul. Namun, bagi sebagian besar pengguna yang mencari kreativitas dan fleksibilitas, ada perasaan yang kuat bahwa performanya justru menurun. Respons OpenAI yang mempertimbangkan untuk mengembalikan GPT-4o bagi pengguna premium adalah bukti bahwa keluhan ini tidak bisa diabaikan.

Baca Juga: Mengenal Perfiki Kreasindo, Studio di Balik Film Animasi Merah Putih: One for All

Mengenal Perfiki Kreasindo, Studio di Balik Film Animasi Merah Putih: One for All