Peningkatan Data Rahsia Besar Yang Akan Tingkatkan Prestasi AI Anda Secara Mendadak

webmaster

A professional Malaysian female AI specialist in a modest lab coat, standing in a brightly lit modern AI research laboratory. She is observing a large digital screen displaying various augmented medical images, such as X-rays or MRI scans, with AI diagnostic overlays. The scene emphasizes innovation and precision in healthcare technology. She has perfect anatomy, correct proportions, and a natural pose. The image should be safe for work, appropriate content, fully clothed, professional, high-quality photograph, realistic rendering, well-formed hands, proper finger count, natural body proportions.

Pernahkah anda terfikir bagaimana model AI yang kita gunakan setiap hari, daripada aplikasi navigasi Waze sehingga cadangan produk di Shopee, dapat berfungsi dengan sangat baik?

Saya masih ingat lagi betapa sukarnya dahulu untuk melatih satu model pembelajaran mesin jika data yang ada terhad, seolah-olah cuba memasak rendang tanpa cukup bahan – hasilnya pasti tidak sesempurna yang kita harapkan.

Namun, seiring dengan kemajuan teknologi, khususnya dalam bidang ‘data augmentation’, cabaran ini semakin dapat diatasi. Dari pengalaman saya sendiri, apabila sesebuah model diberi data yang lebih banyak dan pelbagai melalui teknik ini, prestasinya melonjak secara mendadak.

Ia bukan sekadar menambah data, tetapi memperkayakannya dengan cara yang pintar. Lihat sahaja trend terkini, dengan kemunculan model generatif seperti GPT-4 atau DALL-E yang bukan sahaja boleh mencipta teks atau imej baharu, malah data sintetik yang sangat realistik.

Saya berpendapat, pada masa hadapan, teknik ‘data augmentation’ ini akan menjadi tulang belakang kepada inovasi AI, dari perubatan hinggalah kepada pengalaman membeli-belah dalam talian yang lebih diperibadikan di Malaysia.

Kita akan menyaksikan AI yang lebih cekap, kurang bias, dan mampu belajar daripada jumlah data yang lebih pelbagai, hasil daripada strategi pengayaan data yang semakin canggih.

Saya akan terangkan dengan lebih tepat.

Mengapa Data Augmentation Menjadi Kunci dalam Pembangunan AI Moden

peningkatan - 이미지 1

Dahulu, saya sering berdepan dengan masalah yang sama: membina model AI yang berkesan apabila data latihan sangat terhad. Ia seperti cuba membina sebuah bangunan pencakar langit dengan hanya beberapa bata – mustahil untuk mendapatkan struktur yang kukuh dan berfungsi sepenuhnya.

Tanpa kepelbagaian dan jumlah data yang mencukupi, model AI cenderung untuk ‘overfit’, bermaksud ia hanya berfungsi dengan baik pada data yang telah dilihatnya, tetapi gagal sepenuhnya apabila berdepan dengan situasi baru atau variasi yang tidak dijangka.

Saya masih ingat betapa frustrasinya melihat model yang saya latih berfungsi cantik di komputer saya, tapi bila dicuba di dunia nyata, terus “kelaut”!

Ini adalah sebab utama mengapa ‘data augmentation’ bukan lagi pilihan, tetapi satu keperluan mutlak dalam arena AI hari ini. Ia membolehkan kita mencipta dunia maya data yang lebih luas dan realistik, sekaligus membolehkan model AI belajar daripada pelbagai senario tanpa memerlukan kos pengumpulan data sebenar yang melampau.

1. Atasi Kekangan Data dalam Skala Sebenar

Salah satu cabaran terbesar dalam pembangunan AI, terutamanya dalam aplikasi dunia nyata seperti diagnostik perubatan atau pengecaman objek, adalah kekurangan data berkualiti tinggi dan berlabel.

Bayangkan kita ingin melatih AI untuk mengenal pasti pelbagai jenis penyakit kulit. Adakah kita mempunyai berjuta-juta imej kes kulit yang berbeza, di bawah pelbagai keadaan pencahayaan, daripada pelbagai etnik?

Lazimnya tidak. Data augmentation membolehkan kita mengambil beberapa ratus atau ribu imej sedia ada dan menjadikannya beribu-ribu variasi yang unik melalui pelbagai transformasi.

Dari pengalaman saya, ini bukan sekadar ‘menambah nombor’, tetapi ‘memperkaya pengalaman’ model, sama seperti seorang tukang masak yang belajar cara baru memotong dan mengolah bahan untuk menghasilkan masakan yang lebih beraneka rasa.

2. Meminimumkan Bias dan Meningkatkan Keadilan Model

Satu lagi isu kritikal yang sering membelenggu model AI adalah isu bias. Jika data latihan kita condong kepada satu kumpulan demografi atau situasi tertentu, model AI akan mencerminkan bias tersebut, membawa kepada keputusan yang tidak adil atau tidak tepat untuk kumpulan lain.

Misalnya, jika model pengecaman muka dilatih terutamanya menggunakan data dari satu etnik, ia mungkin kurang tepat apabila mengenal pasti individu dari etnik lain.

Melalui data augmentation, kita boleh mempelbagaikan data sedia ada untuk mewakili spektrum yang lebih luas, membantu mengurangkan bias yang wujud dan menjadikan model AI lebih adil dan inklusif.

Ini bukan sahaja isu teknikal, tetapi juga isu sosial dan etika yang penting untuk kita tangani dalam dunia digital yang semakin berkembang pesat ini.

Teknik Asas Data Augmentation yang Transformasi

Apabila saya mula-mula meneroka data augmentation, saya terkejut betapa banyak cara kreatif yang ada untuk ‘memperbanyakkan’ data sedia ada tanpa perlu keluar dan mengumpul data baharu yang memakan masa dan sumber.

Teknik-teknik ini, walaupun ada yang nampak ringkas, sebenarnya sangat berkuasa dalam meningkatkan prestasi model AI. Ia seperti seorang peniaga di pasar malam yang bijak menggunakan stok bahan sedia ada untuk mencipta pelbagai jenis hidangan yang menarik perhatian pelanggan.

Daripada mengubah saiz imej sehinggalah menukar kedudukan perkataan dalam teks, setiap transformasi kecil mampu menyumbang kepada pembelajaran yang lebih menyeluruh untuk model.

1. Transformasi Imej dan Audio

Untuk data imej, teknik seperti pusingan (rotation), pembalikkan (flipping), memotong (cropping), menukar kecerahan (brightness adjustment), dan menambah hingar (noise injection) adalah sangat popular.

Saya pernah menggunakan teknik ini untuk projek pengecaman objek yang mana hanya ada beberapa ratus gambar objek sasaran. Dengan melakukan pelbagai transformasi, saya dapat menjana ribuan variasi, dan hasilnya, model saya dapat mengecam objek itu dengan ketepatan yang jauh lebih tinggi dalam persekitaran yang berbeza.

Begitu juga dengan data audio, kita boleh menukar kelajuan, pic, atau menambah bunyi latar belakang untuk melatih model pengecaman suara agar lebih tahan lasak terhadap pelbagai keadaan.

2. Strategi Peningkatan Data Berasaskan Teks

Untuk data teks, prosesnya sedikit berbeza tetapi tidak kurang pentingnya. Teknik seperti penggantian sinonim (synonym replacement), pertukaran perkataan (word swapping), atau penterjemahan balik (back-translation, iaitu menterjemah teks ke bahasa lain dan kemudian kembali ke bahasa asal) adalah sangat berguna.

Bayangkan kita ingin melatih model untuk memahami sentimen ulasan pelanggan, tetapi hanya mempunyai beberapa ratus ulasan. Dengan menggantikan perkataan seperti “hebat” dengan “cemerlang” atau “menakjubkan”, kita boleh mencipta variasi baharu tanpa mengubah maksud asal.

Saya pernah mencuba penterjemahan balik dari Bahasa Melayu ke Bahasa Inggeris dan kembali ke Bahasa Melayu, dan hasil teks yang sedikit berbeza itu sangat membantu model bahasa saya memahami nuansa yang lebih luas.

Jenis Data Contoh Teknik Augmentation Manfaat Utama
Imej Pusingan, Pembalikkan, Skala, Kecerahan, Kontras, Menambah Hingar Meningkatkan ketahanan model terhadap variasi visual dan kondisi pencahayaan.
Teks Penggantian Sinonim, Penterjemahan Balik, Penukaran Ayat, Penambahan Perkataan Random Memperkaya pemahaman model bahasa terhadap variasi tatabahasa dan kosa kata.
Audio Perubahan Kelajuan, Perubahan Pic, Penambahan Bunyi Latar Belakang, Pemotongan Audio Melatih model pengecaman suara agar berprestasi baik dalam pelbagai persekitaran bunyi.

Melangkah Lebih Jauh: Data Sintetik dan Generative AI

Teknik augmentation asas memang penting, tapi apa yang membuatkan saya paling teruja sekarang adalah kemunculan data sintetik yang dihasilkan oleh model AI generatif.

Dulu, jika kita perlukan data baharu, kita terpaksa melabur masa dan wang yang banyak untuk mengumpulnya secara manual. Sekarang, dengan kemajuan seperti Generative Adversarial Networks (GANs) dan Variational Autoencoders (VAEs), kita boleh mengarahkan AI untuk mencipta data yang belum pernah wujud, tetapi kelihatan sangat asli!

Perasaan melihat AI menjana wajah manusia yang tidak wujud, atau mencipta ayat yang sangat realistik, adalah satu pengalaman yang menakjubkan dan mengubah perspektif saya tentang apa yang mungkin dalam bidang AI.

Ia seolah-olah kita kini mempunyai mesin pencetak wang, tetapi untuk data, yang mampu menghasilkan “mata wang” yang sangat berharga untuk latihan model AI.

1. Kuasa Rangkaian Generatif Adversarial (GANs)

GANs adalah antara teknologi yang paling revolusioner dalam menjana data sintetik. Saya masih ingat kali pertama saya melihat bagaimana GANs boleh menjana imej wajah manusia yang sangat realistik sehingga sukar dibezakan dengan gambar sebenar.

Konsep di sebalik GANs adalah genius: ia melibatkan dua rangkaian neural – satu “generator” yang mencipta data palsu, dan satu “discriminator” yang cuba membezakan antara data asli dan data palsu.

Kedua-dua ini bersaing dan belajar dari satu sama lain, secara beransur-ansur meningkatkan kemampuan generator untuk mencipta data yang semakin meyakinkan.

Ini bukan sahaja digunakan untuk imej, malah untuk teks, audio, dan juga data 3D. Potensinya dalam mengisi jurang data dan mengatasi isu privasi dengan menjana data yang tidak mengandungi maklumat peribadi adalah sangat besar.

2. Manfaat Data Sintetik dalam Industri Berat

Penerapan data sintetik oleh AI generatif melangkaui sekadar imej dan teks yang ringkas. Dalam industri berat seperti automotif, aeroangkasa, atau perubatan, mengumpul data sebenar untuk senario jarang berlaku atau berbahaya adalah sangat mencabar, dan kadangkala mustahil.

Contohnya, melatih kenderaan autonomi untuk menghadapi situasi kemalangan yang jarang berlaku memerlukan data yang banyak tetapi mustahil untuk dikumpul melalui ujian jalan raya.

Di sinilah data sintetik memainkan peranan penting. Syarikat kini menggunakan simulasi dan model generatif untuk mencipta berjuta-juta jam data senario bahaya, membolehkan AI belajar dari situasi yang tidak dapat ditemui dalam dunia nyata.

Dari sudut pandang saya, ini bukan sahaja mempercepatkan pembangunan, malah meningkatkan keselamatan produk dan perkhidmatan.

Impak Nyata Data Augmentation dalam Industri di Malaysia

Saya telah menyaksikan sendiri bagaimana teknik data augmentation ini telah mula mengubah landskap industri di Malaysia. Bukan sekadar teori dalam makmal universiti, malah ia telah diaplikasikan secara meluas dari syarikat pemula hinggalah konglomerat besar.

Kesannya sangat ketara, terutamanya dalam bidang di mana data adalah raja, tetapi data yang mencukupi sering menjadi isu. Ia seolah-olah ‘membebaskan’ potensi AI di negara kita, membolehkan pembangunan aplikasi yang lebih pintar dan responsif kepada keperluan masyarakat tempatan.

Saya rasa sangat bangga melihat bagaimana teknologi ini mula memberikan impak positif dalam kehidupan seharian kita.

1. Revolusi dalam Sektor Kesihatan dan Pertanian

Dalam sektor kesihatan, data augmentation membantu mengatasi kekurangan data perubatan yang berlabel, terutamanya untuk penyakit jarang berlaku. Doktor di Malaysia kini boleh menggunakan sistem AI yang lebih tepat untuk mendiagnosis penyakit daripada imej perubatan seperti X-ray atau MRI, hasil daripada model yang dilatih dengan data yang diperkaya.

Saya sendiri pernah mengikuti satu bengkel di mana penyelidik tempatan menunjukkan bagaimana mereka menggunakan teknik ini untuk melatih AI mengenal pasti penyakit pada tanaman sawit dengan lebih awal, membantu pekebun kecil meningkatkan hasil tuaian mereka.

Bayangkan, dengan hanya beberapa ratus imej daun sakit, mereka boleh mencipta ribuan variasi untuk melatih AI yang akhirnya dapat menyelamatkan banyak hasil pertanian negara!

2. Pemerkasaan E-Dagang dan Perkhidmatan Kewangan

Platform e-dagang seperti Shopee dan Lazada di Malaysia sentiasa berdepan dengan cabaran untuk memberikan cadangan produk yang relevan kepada pengguna.

Dengan jutaan produk dan data interaksi yang kompleks, data augmentation membantu mereka memahami corak pembelian yang lebih halus. Contohnya, jika data pengguna baru terhad, mereka boleh menjana profil pengguna sintetik berdasarkan tingkah laku pengguna sedia ada, membolehkan AI cadangan berfungsi dengan lebih berkesan sejak awal.

Dalam perkhidmatan kewangan pula, bank dan syarikat fintech menggunakan data augmentation untuk melatih model pengesanan penipuan. Dengan menjana senario penipuan sintetik berdasarkan kes-kes sebenar, model AI menjadi lebih mahir dalam mengenal pasti aktiviti mencurigakan yang baru dan tidak pernah dilihat sebelum ini.

Ini adalah satu langkah besar dalam melindungi pengguna dan sistem kewangan negara kita.

Cabaran dan Pertimbangan Etika dalam Pengayaan Data

Walaupun data augmentation menawarkan potensi yang luar biasa, adalah penting untuk tidak mengabaikan cabaran dan pertimbangan etika yang datang bersamanya.

Saya selalu ingatkan rakan-rakan pembangun AI saya bahawa kuasa yang besar datang dengan tanggungjawab yang besar. Kita perlu berhati-hati agar tidak mencipta masalah baru dalam usaha menyelesaikan masalah lama.

Ada masanya saya sendiri terfikir, adakah data sintetik ini benar-benar mencerminkan realiti, atau sekadar ilusi yang boleh memesongkan model kita jika tidak dikendalikan dengan betul?

1. Mengurus Kualiti dan Keaslian Data yang Diperkaya

Salah satu cabaran utama adalah memastikan kualiti data yang diperkaya. Jika teknik augmentation tidak diaplikasikan dengan betul, ia boleh menghasilkan data yang tidak realistik atau terlalu mudah dikenali sebagai ‘tiruan’, yang akhirnya akan mengurangkan prestasi model dan bukannya meningkatkannya.

Ada kalanya, model AI mungkin belajar “membezakan” antara data asli dan data yang diperkaya, menyebabkan ia gagal mengenali data asli dalam senario sebenar.

Dari pengalaman saya, ia memerlukan pemahaman mendalam tentang domain data dan eksperimentasi berterusan untuk mencari kombinasi teknik augmentation yang optimum.

Kita perlu memastikan bahawa proses pengayaan data tidak memperkenalkan bias baru atau “noise” yang tidak perlu ke dalam set data.

2. Aspek Moral dan Ketelusan dalam Data Sintetik

Apabila kita mula menggunakan AI generatif untuk mencipta data sintetik, persoalan etika menjadi lebih kompleks. Contohnya, adakah kita perlu mendedahkan jika sesuatu model dilatih menggunakan data sintetik?

Bagaimana pula jika data sintetik itu secara tidak sengaja mencerminkan bias yang tersembunyi dari data latihan asal, dan kemudian bias itu diperkuatkan?

Isu privasi juga timbul; walaupun data sintetik tidak mengandungi maklumat peribadi individu sebenar, ada potensi untuk maklumat sensitif “terbocor” jika model generatif dilatih pada data yang sangat khusus.

Saya percaya, ketelusan dan garis panduan etika yang jelas perlu dibangunkan untuk memastikan teknologi ini digunakan secara bertanggungjawab dan tidak disalahgunakan.

Ini adalah perbincangan penting yang perlu kita adakan sebagai komuniti AI di Malaysia.

Masa Depan Data Augmentation: Adaptasi dan Inovasi Berterusan

Melihat ke hadapan, saya yakin data augmentation akan terus menjadi tunjang utama dalam pembangunan AI. Namun, ia tidak akan statik. Saya menjangkakan kita akan melihat evolusi yang lebih pintar dan adaptif dalam bagaimana data diperkaya.

Daripada sekadar teknik yang statik, ia akan menjadi proses yang dinamik, di mana model AI itu sendiri mungkin akan terlibat dalam menentukan bagaimana data yang paling efektif perlu dijana untuk pembelajarannya.

Saya sangat teruja untuk melihat bagaimana teknologi ini akan terus berkembang dan membuka lebih banyak pintu kepada aplikasi AI yang lebih canggih dan bijak dalam kehidupan seharian kita.

1. Integrasi dengan Pembelajaran Aktif dan Meta-Pembelajaran

Pada masa hadapan, saya percaya data augmentation akan lebih bersepadu dengan konsep pembelajaran aktif (active learning) dan meta-pembelajaran (meta-learning).

Pembelajaran aktif membolehkan model mengenal pasti data mana yang paling berfaedah untuk dilabel dan dipelajari. Bayangkan sebuah sistem AI yang boleh berkata, “Saya memerlukan lebih banyak contoh untuk situasi ini, dan saya cadangkan bagaimana data baru itu boleh dijana melalui augmentation.” Ini akan menjadikan proses latihan AI jauh lebih cekap dan kurang bergantung kepada intervensi manusia yang berterusan.

Dengan meta-pembelajaran, model AI boleh belajar cara terbaik untuk melakukan augmentation itu sendiri, menyesuaikan teknik berdasarkan jenis data dan tugasan yang diberikan.

Ini akan menjadi satu revolusi dalam keupayaan model untuk belajar secara autonomi.

2. AI yang Lebih Cerdik dan Responsif Melalui Data Adaptif

Akhirnya, melalui evolusi data augmentation yang berterusan, kita akan menyaksikan AI yang lebih cerdik dan responsif. Ia akan mampu belajar daripada jumlah data yang lebih pelbagai, bukan hanya dari apa yang telah dikumpul secara manual, tetapi juga dari apa yang boleh dijana secara pintar.

Ini bermakna model AI akan menjadi lebih tahan lasak terhadap variasi, kurang bias, dan lebih adil dalam keputusannya. Saya membayangkan masa depan di mana AI boleh beradaptasi dengan cepat kepada persekitaran yang berubah-ubah, sama ada dalam kereta autonomi yang beroperasi di jalan raya Malaysia yang pelbagai, atau dalam sistem diagnostik perubatan yang sentiasa mengemaskini pengetahuannya.

Data augmentation akan menjadi enjin yang tidak kelihatan di sebalik kecerdasan buatan yang sentiasa belajar dan beradaptasi.

Kata Penutup

Data augmentation bukan lagi sekadar teknik sampingan, tetapi tulang belakang kepada pembangunan AI yang canggih dan berkesan. Dari mengatasi kekangan data hingga mencipta model yang lebih adil dan pintar, potensinya tidak terbatas. Saya percaya, dengan inovasi berterusan dan penggunaan yang beretika, kita akan menyaksikan AI yang mampu beradaptasi, belajar, dan melayani keperluan manusia dengan cara yang lebih bermakna. Mari kita terus meneroka dan memanfaatkan kuasa data augmentation untuk masa depan AI yang lebih cerah dan inklusif di Malaysia.

Info Berguna untuk Anda Ketahui

1. Mulakan dengan teknik asas: Anda tidak perlu melabur dalam AI generatif yang kompleks pada mulanya. Teknik asas seperti pusingan imej atau penggantian sinonim sudah cukup untuk memberi impak besar pada projek permulaan anda.

2. Pilih data yang betul: Pastikan data asal yang anda miliki adalah berkualiti sebelum melakukan augmentation. Menambah data buruk hanya akan menghasilkan lebih banyak data buruk.

3. Jangan ‘over-augment’: Terlalu banyak augmentasi atau teknik yang tidak sesuai boleh menyebabkan model anda ‘keliru’ dan gagal belajar ciri-ciri penting dari data asli.

4. Pertimbangkan etika: Apabila menggunakan data sintetik, sentiasa fikirkan tentang privasi dan bias yang mungkin terbawa-bawa. Ketelusan dalam penggunaan data adalah kunci.

5. Eksperimen selalu: Dunia AI sentiasa berubah. Cuba pelbagai kombinasi teknik data augmentation dan ukur kesannya terhadap prestasi model anda. Belajar dari setiap eksperimen!

Rumusan Penting

Data augmentation adalah teknologi fundamental yang mengatasi masalah kekangan data, mengurangkan bias, dan meningkatkan ketahanan serta keadilan model AI. Ia merangkumi teknik tradisional seperti transformasi imej dan teks, hingga inovasi terkini seperti data sintetik dari AI generatif (GANs). Kesannya telah mengubah pelbagai industri di Malaysia, dari kesihatan hingga e-dagang. Walau bagaimanapun, pengurusan kualiti data yang diperkaya dan pertimbangan etika dalam penggunaan data sintetik adalah penting untuk memastikan pembangunan AI yang bertanggungjawab dan mampan.

Soalan Lazim (FAQ) 📖

S: Apakah ‘data augmentation’ itu sebenarnya, dan mengapa ia menjadi tunjang utama dalam kemajuan kecerdasan buatan (AI) hari ini?

J: Pada pandangan saya, ‘data augmentation’ ini ibarat kita ada resipi rendang yang hebat, tapi kita nak jadikan ia lebih mantap dan boleh dihidangkan untuk semua.
Dulu, saya teringat betapa susahnya nak melatih model AI kalau data yang kita ada tu sikit sangat, macam nak buat nasi lemak tapi sambal tak cukup pedas – hasilnya tak memuaskan.
‘Data augmentation’ ni datang dengan cara menambah kepelbagaian pada data sedia ada secara pintar, bukan sekadar salin tampal. Ia mungkin ubah sedikit sudut gambar, pusingkan teks, atau pelbagai cara lain untuk “menghasilkan” data baharu dari yang asal.
Dari pengalaman saya sendiri, apabila model AI tu disuap data yang dah di-augment, prestasinya naik mendadak, ia jadi lebih cekap dan kurang silap. Macam Waze tu, dulu kalau ada jalan baru, lambat betul dia nak ‘belajar’.
Sekarang, dengan data augmentation, ia boleh ramal trafik dengan lebih tepat, walaupun di lorong-lorong kecil di Bangsar atau Jalan Tun Razak tu. Pentingnya tu, ia bantu model AI belajar dengan lebih baik walaupun data sebenar terhad, menjadikan AI lebih robust dan berkesan.

S: Bagaimana pula dengan kemunculan model generatif seperti GPT-4 atau DALL-E? Adakah ia mengubah cara kita melihat atau melaksanakan ‘data augmentation’ secara keseluruhan?

J: Memanglah model generatif ni dah tukar banyak benda! Dulu, bila sebut ‘data augmentation’, kita fikir pasal putar gambar sikit, ubah suara sikit, teknik yang lebih “mekanikal”.
Tapi sekarang, dengan kemunculan model generatif macam GPT-4 untuk teks atau DALL-E untuk imej, kita boleh hasilkan data sintetik yang sangat realistik dan ‘original’ terus.
Ini bukan lagi sekadar mengubah suai, tapi mencipta. Saya rasa, ini macam kita tak perlu lagi susah payah cari bahan mentah kat pasar borong untuk buat rendang, tiba-tiba je semua dah ada depan mata, siap boleh ‘cipta’ bahan yang tak wujud pun tapi nampak macam asli dan sedap.
Ia membuka dimensi baharu dalam ‘data augmentation’ kerana model AI kini boleh mencipta data yang belum pernah wujud tapi sangat meyakinkan, membolehkan model lain belajar daripada set data yang jauh lebih besar dan pelbagai.
Ini tentunya mempercepatkan pembangunan AI dan menjadikan ia lebih pintar dan mampu menyelesaikan masalah yang lebih kompleks.

S: Pada pandangan anda, bagaimanakah masa depan ‘data augmentation’ akan membentuk inovasi AI dan memberi impak kepada kehidupan kita di Malaysia?

J: Pada pandangan saya, ‘data augmentation’ akan menjadi tulang belakang kepada hampir semua inovasi AI yang kita akan saksikan di Malaysia nanti. Bayangkan dalam bidang perubatan, doktor boleh diagnosis penyakit jarang jumpa dengan lebih cepat dan tepat, sebab AI dah dilatih dengan data sintetik yang kaya, mengurangkan kesilapan manusia dan menyelamatkan nyawa.
Tak perlu lagi nak tunggu kes sebenar banyak baru AI boleh ‘belajar’. Atau pengalaman membeli-belah dalam talian di Shopee atau Lazada, ia akan jadi lebih peribadi dan tepat.
AI boleh cadang produk yang betul-betul kita nak, bukan sekadar ‘orang lain beli ni juga’, tapi berdasarkan gaya hidup, minat, dan mungkin juga saiz baju yang memang kita pakai.
Saya sangat yakin, kita akan menyaksikan AI yang lebih cekap, kurang bias (sebab data latihan lebih seimbang), dan mampu beradaptasi dengan cabaran tempatan kita, dari masalah trafik di Kuala Lumpur hinggalah kepada pengurusan bencana banjir.
Ini bukan sekadar cerita sains fiksyen, ini realiti yang akan kita hadapi tak lama lagi, menjadikan hidup kita lebih mudah dan pintar.