Data itu dimasukkan ke dalam algoritma machine learning dan menghasilkan sebuah model AI. Machine learning akan mempelajari pola di dalam data.
"Data ini juga memiliki jenis yang bermacam-macam, pembagiannya dapat berupa data supervised dan data unsupervised," ujar Dr Ayu.
Jadi, tutur Dr Ayu, data supervised harus diberikan penambahan label data secara manual. Sebagai contoh data pada media sosial (medsos) akan secara manual diberikan label positif, negatif atau netral oleh seorang data annotator.
Meskipun saat ini sudah ada jenis data semi-supervised yang pemberian labelnya secara otomatis dan nanti akan dicek kembali.
Berbeda dengan data unsupervised, yang tidak perlu ada label data dan kedua jenis data ini memiliki tugas yang berbeda.
“Hal yang menarik adalah Pre-trained Generative Large Language Model dibangun secara unsupervised. Jadi ChatGPT itu mengumpulkan semua data dokumen di internet, termasuk source code digabungkan tanpa diberikan label. Semua data dimasukkan ke dalam algoritma deep learning GPT,” tutur dia.
Editor : Agus Warsudi
kecerdasan buatan artificial intelligence dosen itb itb itb bandung Kampus ITB Kota Bandung pakar itb educate me
Artikel Terkait