Apa sebenarnya yang dimaksud dengan 'AI sumber terbuka'?
Itu pertarungan antara perangkat lunak sumber terbuka dan perangkat lunak berpemilik dipahami dengan baik. Namun ketegangan telah merembes ke kalangan perangkat lunak selama beberapa dekade telah diacak ke dalam bidang kecerdasan buatan, sebagian karena tidak ada satupun yang sepakat mengenai apa sebenarnya arti “open source” dalam konteks AI.
New York Times baru-baru ini menerbitkan penilaian yang mengalir deras CEO Meta Mark Zuckerberg, mencatat bagaimana penerapan “AI open source” telah menjadikannya populer sekali lagi di Silicon Valley. Namun menurut sebagian besar perkiraan, Meta Bermerek Llama model bahasa besar tidak benar-benar open sourceyang menyoroti inti perdebatan.
Tantangan inilah yang menjadi tantangan bagi Inisiatif Open Source (OSI) sedang mencoba untuk mengatasi, dipimpin oleh direktur eksekutif Stefano Maffulli (gambar di atas), melalui konferensi, lokakarya, panel, webinar, laporan, dan lainnya.
AI bukanlah kode perangkat lunak
OSI telah menjadi pengurusnya Definisi Sumber Terbuka (OSD) selama lebih dari seperempat abad, menjelaskan bagaimana istilah “open source” dapat, atau seharusnya, diterapkan pada perangkat lunak. Lisensi yang memenuhi definisi ini secara sah dapat dianggap sebagai “sumber terbuka”, meskipun lisensi tersebut mengakui a spektrum lisensi mulai dari sangat permisif hingga tidak terlalu permisif.
Namun mengalihkan lisensi lama dan konvensi penamaan dari perangkat lunak ke AI merupakan suatu permasalahan. Joseph Jackpenginjil sumber terbuka dan pendiri perusahaan VC Modal OSSbahkan mengatakan bahwa ada “tidak ada yang namanya AI sumber terbuka,” mencatat bahwa “open source diciptakan secara eksplisit untuk kode sumber perangkat lunak.” Lebih jauh, “jaringan syaraf bobot” (NNWs) — istilah yang digunakan dalam dunia kecerdasan buatan untuk menggambarkan parameter atau koefisien yang digunakan jaringan untuk belajar selama proses pelatihan — sama sekali tidak sebanding dengan perangkat lunak.
“Bobot bersih neural bukanlah kode sumber perangkat lunak; mereka tidak dapat dibaca oleh manusia, [and they are not] dapat di-debug,” catatan Jacks. “Selain itu, hak-hak dasar open source juga tidak diterapkan pada NNW dengan cara yang selaras.”
Inkonsistensi ini tahun lalu dipimpin oleh Jacks dan rekannya di OSS Capital Heather Meeker ke datang dengan definisi mereka sendiri tentang macam-macam, seputar konsep “bobot terbuka”. Dan Maffulli, terlepas dari manfaatnya, setuju dengan mereka. “Intinya benar,” katanya kepada TechCrunch. “Salah satu perdebatan awal yang kami lakukan adalah apakah akan menyebutnya sebagai AI open source, tetapi semua orang sudah menggunakan istilah tersebut.”
Didirikan pada tahun 1998, OSI adalah perusahaan nirlaba yang bergerak di bidang kepentingan publik yang melakukan berbagai aktivitas terkait sumber terbuka seputar advokasi, pendidikan, dan alasan utamanya: Definisi Sumber Terbuka. Saat ini, organisasi ini mengandalkan sponsor untuk pendanaan, dengan anggota terhormat seperti Amazon, Google, Microsoft, Cisco, Intel, Salesforce, dan Meta.
Keterlibatan Meta dengan OSI sangat penting saat ini karena berkaitan dengan gagasan “AI open source.” Meskipun Meta menggantungkan topi AI-nya pada pasak sumber terbukaperusahaan ini mempunyai batasan penting mengenai bagaimana model Llama dapat digunakan: Tentu, model tersebut dapat digunakan secara gratis untuk penelitian dan kasus penggunaan komersial, namun pengembang aplikasi dengan lebih dari 700 juta pengguna bulanan harus meminta lisensi khusus dari Meta, yang mana ia akan memberikan murni atas kebijakannya sendiri.
Bahasa Meta di sekitar LLM-nya agak mudah ditempa. Sementara perusahaan memang meneleponnya Sumber terbuka model Llama 2dengan kedatangan Llama 3 pada bulan April, istilah ini agak menyimpang dari terminologinya, menggunakan frase seperti “tersedia secara terbuka” dan “dapat diakses secara terbuka”. Namun di beberapa tempat justru demikian masih mengacu pada modelnya sebagai “sumber terbuka”.
“Semua orang yang terlibat dalam percakapan ini sangat setuju bahwa Llama sendiri tidak dapat dianggap open source,” kata Maffulli. “Orang-orang yang pernah berbicara dengan saya dan bekerja di Meta, mereka tahu bahwa ini agak sulit.”
Selain itu, beberapa orang mungkin berpendapat bahwa ada konflik kepentingan di sini: sebuah perusahaan yang telah menunjukkan keinginan untuk mendukung branding open source juga memberikan pendanaan kepada pengelola “definisi”?
Inilah salah satu alasan mengapa OSI mencoba mendiversifikasi pendanaannya, dengan baru-baru ini mendapatkan hibah dari OSI Yayasan Sloan, yang membantu mendanai dorongan global multi-pemangku kepentingan untuk mencapai Definisi AI Sumber Terbuka. TechCrunch dapat mengungkapkan jumlah hibah ini sekitar $250.000, dan Maffulli berharap hal ini dapat mengubah pandangan mengenai ketergantungannya pada pendanaan perusahaan.
“Itulah salah satu hal yang semakin jelas dari hibah Sloan: Kita bisa mengucapkan selamat tinggal pada uang Meta kapan saja,” kata Maffulli. “Kita bisa melakukan itu bahkan sebelum Sloan Grant ini, karena saya tahu kita akan mendapatkan sumbangan dari orang lain. Dan Meta mengetahui hal itu dengan baik. Mereka tidak ikut campur dalam semua ini [process]begitu pula Microsoft, GitHub, Amazon, atau Google — mereka benar-benar tahu bahwa mereka tidak dapat ikut campur, karena struktur organisasi tidak mengizinkan hal itu.”
Definisi kerja AI sumber terbuka
Draf Definisi AI Sumber Terbuka saat ini ada di versi 0.0.8, yang terdiri dari tiga bagian inti: “pembukaan”, yang menjabarkan kewenangan dokumen; Definisi AI Sumber Terbuka itu sendiri; dan daftar periksa yang menelusuri komponen-komponen yang diperlukan untuk sistem AI yang sesuai dengan sumber terbuka.
Sesuai dengan rancangan saat ini, sistem AI Open Source harus memberikan kebebasan untuk menggunakan sistem untuk tujuan apa pun tanpa meminta izin; untuk memungkinkan orang lain mempelajari cara kerja sistem dan memeriksa komponen-komponennya; dan untuk memodifikasi dan berbagi sistem untuk tujuan apa pun.
Namun salah satu tantangan terbesar adalah seputar data — yaitu, dapatkah sistem AI diklasifikasikan sebagai “open source” jika perusahaan belum menyediakan kumpulan data pelatihan untuk dimanfaatkan oleh pihak lain? Menurut Maffulli, yang lebih penting adalah mengetahui dari mana data tersebut berasal, dan bagaimana pengembang memberi label, menghapus duplikasi, dan memfilter data tersebut. Dan juga, memiliki akses ke kode yang digunakan untuk merakit kumpulan data dari berbagai sumbernya.
“Jauh lebih baik mengetahui informasi tersebut daripada memiliki kumpulan data biasa tanpa data lainnya,” kata Maffulli.
Meskipun memiliki akses ke kumpulan data lengkap akan menyenangkan (OSI menjadikan ini sebagai komponen “opsional”), Maffulli mengatakan bahwa hal ini tidak mungkin atau tidak praktis dalam banyak kasus. Hal ini mungkin terjadi karena terdapat informasi rahasia atau berhak cipta dalam kumpulan data yang tidak boleh didistribusikan ulang oleh pengembang. Selain itu, terdapat teknik untuk melatih model pembelajaran mesin yang datanya sendiri tidak dibagikan dengan sistem, menggunakan teknik seperti pembelajaran gabungan, privasi diferensial, dan enkripsi homomorfik.
Dan hal ini secara sempurna menyoroti perbedaan mendasar antara “perangkat lunak sumber terbuka” dan “AI sumber terbuka”: Tujuannya mungkin serupa, namun keduanya tidak dapat dibandingkan, dan perbedaan inilah yang coba ditangkap oleh OSI di dalamnya. definisi.
Dalam perangkat lunak, kode sumber dan kode biner adalah dua pandangan dari artefak yang sama: Keduanya mencerminkan program yang sama dalam bentuk yang berbeda. Namun kumpulan data pelatihan dan model yang dilatih berikutnya merupakan hal yang berbeda: Anda dapat menggunakan kumpulan data yang sama, dan Anda belum tentu dapat membuat ulang model yang sama secara konsisten.
“Ada berbagai logika statistik dan acak yang terjadi selama pelatihan sehingga tidak dapat direplikasi dengan cara yang sama seperti perangkat lunak,” tambah Maffulli.
Jadi sistem AI open source harus mudah direplikasi, dengan instruksi yang jelas. Dan di sinilah aspek daftar periksa Definisi AI Sumber Terbuka berperan, yang didasarkan pada a makalah akademis yang baru saja diterbitkan berjudul “Kerangka Keterbukaan Model: Mempromosikan Kelengkapan dan Keterbukaan untuk Reproduksibilitas, Transparansi, dan Kegunaan dalam Kecerdasan Buatan.”
Makalah ini mengusulkan Model Openness Framework (MOF), sebuah sistem klasifikasi yang menilai model pembelajaran mesin “berdasarkan kelengkapan dan keterbukaannya.” Kementerian Keuangan menuntut agar komponen spesifik dari pengembangan model AI “dimasukkan dan dirilis di bawah lisensi terbuka yang sesuai,” termasuk metodologi pelatihan dan rincian seputar parameter model.
Kondisi yang stabil
OSI menyebut peluncuran resmi definisi tersebut sebagai “versi stabil”, seperti yang akan dilakukan perusahaan terhadap aplikasi yang telah menjalani pengujian ekstensif dan debugging sebelum prime time. OSI sengaja tidak menyebutnya sebagai “rilis final” karena sebagian darinya kemungkinan besar akan berkembang.
“Kami tidak dapat mengharapkan definisi ini bertahan selama 26 tahun seperti Definisi Open Source,” kata Maffulli. “Saya tidak mengharapkan definisi bagian atas — seperti ‘apa itu sistem AI?’ — untuk banyak berubah. Tapi bagian-bagian yang kita rujuk di checklist, daftar komponen itu bergantung pada teknologi? Besok, siapa yang tahu teknologinya akan seperti apa.”
Definisi AI Open Source yang stabil diharapkan dapat disetujui oleh Dewan di Konferensi Semua Hal Terbuka pada akhir bulan Oktober, OSI memulai roadshow global pada bulan-bulan berikutnya yang mencakup lima benua, mencari lebih banyak “masukan yang beragam” tentang bagaimana “AI open source” akan didefinisikan di masa depan. Namun perubahan akhir apa pun kemungkinan besar hanya sekedar “perubahan kecil” di sana-sini.
“Ini adalah peregangan terakhir,” kata Maffulli. “Kami telah mencapai versi definisi yang lengkap; kami memiliki semua elemen yang kami butuhkan. Sekarang kami memiliki daftar periksa, jadi kami memeriksa apakah tidak ada kejutan di sana; tidak ada sistem yang harus dimasukkan atau dikecualikan.”
Apa sebenarnya yang dimaksud dengan 'AI sumber terbuka'?
Judul : Belajar Microsoft Office (WordBelajar Microsoft Office (Word, Excel, Powerpoint) 2019 Dengan Mudah Dan Menyenangkan Penulis : Johnie Rogers Swanda Pasaribu S.kom. , M.kom. Halaman : xviii, 182 hlm Uk: 17.5×25 cm ISBN: 978-623-02-0180-6 Tahun : 2019 Microsoft Office yang antara terdiri dari aplikasi Word, Excel dan Powerpoint merupakan aplikasi pengolah kata, aplikasi pengolah… selengkapnya
Rp 108.000Judul : Sinopsis Buku Ekonometrika Pengantar Teori dan Aplikasinya (Disertai Panduan dalam IBM SPSS) Penulis : Depy Muhamad Pauzy, Gian Riksa Wibawa Halaman : viii, 102 hlm Uk: 15.5×23 cm ISBN: 978-623-7022-97-8 Tahun : 2023 Dalam buku Ekonometrika ini akan dipelajari tentang konsep teori dan bagaimana cara mengolah data statistika dengan menggunakan software SPSS, yaitu cara menginstal software dan mengoperasikannya, menyajikan… selengkapnya
Rp 155.000Judul : Kata Kerja Bahasa Inggris Mengenali Bentuk Visualnya Penulis : Yune Andryani Pinem Halaman : xii, 126 hlm Uk: 15.5×23 cm ISBN : 978-623-02-5088-0 Tahun : 2022 Menyusun kalimat dalam bahasa Inggris dilakukan menyesuaikan tata bahasanya. Dengan susunan kalimat yang benar, pesan pada kalimat dapat diterima dengan baik. Struktur kalimat bahasa Inggris menggunakan verb… selengkapnya
Rp 128.000Judul : Desain dan Perencanaan Pembelajaran Penulis : Dr. H. Rudi Ahmad Suryadi, M.Ag. Drs. H. Aguslani Mushlih, M.Ag. Halaman : xiv, 200 hlm Uk: 17.5×25 cm ISBN: 978-623-209-803-9 Tahun : 2019 Buku Desain dan Perencanaan Pembelajaran – Mutu pembelajaran salah satunya ditunjang oleh kompetensi guru. Guru menjadi personal penting dalam interaksi pembelajaran untuk mewujudkan tujuan… selengkapnya
Rp 115.000Judul : Sejarah Tidung Kalimantan Utara Penulis : dr. Syahriza Pahlevi Halaman : xiv, 267 hlm Uk: 14×20 cm ISBN : 978-623-02-3565-8 Tahun : 2020 Kalimantan Utara menjadi sorotan bangsa asing kala itu. Suku Tidung menjadi pelaku perdagangan tradisional. Sebelumnya terkenal buas karena perburuan budak di Filipina dan aktif dalam membajak kapal. Tidung dipandang bar-bar… selengkapnya
Rp 119.000Judul : Hukum Waris Islam Penulis : Dr. Iman Jauhari, S.H., M.Hum. , Dr. T. Muhammad Ali Bahar, S.H., M.Kn. Halaman : viii, 112 hlm Uk: 15.5×23 cm ISBN : 978-623-02-3306-7 Tahun : 2021 “Waris dalam bahasa Indonesia disebut pusaka, yaitu harta benda dan hak yang ditinggalkan oleh orang yang mati untuk dibagikan kepada yang… selengkapnya
Rp 82.000Judul : Biologi Kuskus Penulis : Prof. Dr. drh. Rini Widayanti, M.P. Rony Marsyal Kunda, M.Sc Halaman : x, 59 hlm Uk: 15.5×23 cm ISBN: 978-623-02-5953-1 Tahun : 2023 Julukan Wallacea sebagai sepenggal surga di Bumi, sangat tepat. Kawasan ini menyimpan kekayaan keanekaragaman hayati, bentang alam, dan budaya tradisional luar biasa dan terus menunjukkan pesona… selengkapnya
*Harga MulaiRp 86.000
Judul : Perspektif Perdagangan Beras Antarpulau di Indonesia Penulis : Dr. Ir. Hj. Majdah Muhyiddin Zain, M.Si. Halaman : viii, 188 hlm Uk: 15.5×23 cm ISBN: 978-623-02-5942-5 Tahun : 2023 Perdagangan beras berfungsi untuk menjaga stok beras yang cukup bagi pemenuhan kebutuhan domestik suatu wilayah atau negara. Penyuplai beras utama di Indonesia di antaranya Provinsi… selengkapnya
Rp 156.000Judul : Teknik Penyusunan Laporan Keuangan Berbasis Software Akuntansi Penulis : Irwan Adimas Ganda Saputra, S.Pd., M.A. Bayu Rama Laksono, S.E., M.Ak. Prof. Dr. Hariyati, Ak., M.Si., CA., CMA. Halaman : vi, 72 halaman Uk: 17.5×25 cm ISBN: 978-623-02-5963-0 Tahun : 2023 Buku Teknik Penyusunan Laporan Keuangan Berbasis Software Akuntansi Versi terbaru dari software akuntansi… selengkapnya
*Harga MulaiRp 122.000
Judul : Pencemaran Lingkungan Penulis : Prof. Dr. Ir. Odi Roni Pinontoan, M.S. Halaman : viii, 80 hlm Uk: 15.5×23 cm ISBN: 978-623-02-7363-6 Tahun : 2023 Pencemaran lingkungan (environmental pollution) adalah terkontaminasinya komponen fisik dan biologis dari sistem bumi dan atmosfer sehingga mengganggu keseimbangan ekosistem lingkungan. Kontaminasi tersebut bisa berasal dari kegiatan manusia ataupun proses… selengkapnya
Rp 103.000
Saat ini belum tersedia komentar.