Byte

Mengenal arXiv: Situs web Kuno yang Jadi Fondasi Pengembangan AI

Tampilannya kuno dan membosankan. Namun siapa sangka situs web ini adalah arsip yang menyimpan kumpulan paper yang menjadi fondasi kecerdasan buatan.

Yoga Cholandha

Terbit 20 May 2025 18:00 WIB

Logo arXiv. (FOTO/arxiv.org)

Jadikan tirto.id sumber pilihan pencarian Google

tirto.id - Di tengah berbagai kehebohan dan kemeriahan yang menyertai terobosan kecerdasan buatan (artificial intelligence/AI) terbaru, ada sebuah situs web yang tersembunyi di balik reruntuhan relik Web 1.0. Tampilannya kuno, layaknya website yang diciptakan lebih dari tiga dekade silam. Akan tetapi, tanpa situs web ini, ledakan AI yang ada sekarang, barangkali, tidak akan pernah terjadi.

Nama website itu arXiv (dibaca: archive) dan Anda bisa mengaksesnya di alamat arXiv.org. Situs web ini berada di bawah naungan Cornell University karena pendirinya, Paul Ginsparg, adalah pengajar fisika di sana.

Pada dasarnya, arXiv adalah sebuah platform bagi para ilmuwan untuk membagikan preprint, makalah riset yang disebarkan sebelum melewati proses peer review. Awalnya, Ginsparg hanya bermaksud membuka platform ini untuk sesama fisikawan. Namun, dalam perkembangannya, ilmuwan dari disiplin lain pun turut menggunakan arXiv untuk membagikan preprint mereka. Di situ web ini Anda bisa menemukan paper matematika, ilmu komputer, biologi, keuangan, dan tentu saja kecerdasan buatan.

Sama sekali tidak ada yang spesial dari tampilan maupun fitur arXiv. Website ini tidak pernah didesain untuk menggaet engagement atau memukau mata para pengunjungnya. Bahkan, di homepage, satu-satunya gambar yang ditampilkan hanyalah logo dari Cornell University. Selebihnya? Teks, teks, dan teks.

Meski demikian, justru di situ letak dari kekuatan arXiv. Seperti namanya, arXiv memang berfungsi sebagai sarana pengarsipan. Yang terpenting dari konten arXiv adalah bagaimana mereka diklasifikasikan dalam kategori disiplin ilmu serta kata kunci untuk pencarian. Dan bicara soal pencarian, website ini sama sekali tidak mengenal algoritma. Semua pencarian dilakukan secara manual, persis seperti ketika kita sedang berkunjung ke perpustakaan.

Saat ini, arXiv menyimpan lebih dari 2,6 juta makalah riset. Setiap bulannya, ada sekitar 20 ribu makalah baru yang didaftarkan ke dalamnya dan, setiap bulannya pula, situs web ini dikunjungi kurang lebih 5 juta orang. Mereka yang mengunjungi arXiv adalah para peneliti, pengembang, dan mahasiswa yang berusaha mengejar inovasi lintas disiplin.

Pertanyaannya sekarang, bagaimana website yang membosankan ini bisa menjadi katalis utama perkembangan AI?

Keterbukaan arXiv vs Ketertutupan Laboratorium AI

Sampai sekarang, laboratorium AI Anthropic sama sekali tidak pernah membocorkan berapa biaya yang mereka keluarkan untuk mengembangkan chatbot andalannya, Claude. Selama ini, orang hanya bisa menerka-nerka berdasarkan pembiayaan yang didapatkan oleh laboratorium-laboratorium tersebut.

Pengembangan AI memang seakan-akan serba rahasia dan sangat tertutup. Alasan-alasan seperti faktor keamanan, keunggulan komparatif, dan properti intelektual senantiasa dikeluarkan untuk menjustifikasi ketertutupan tersebut. Tidak sepenuhnya salah, memang, karena pengembangan model AI kiwari merupakan proyek bernilai jutaan, bahkan miliaran dolar.

Kendati begitu, spirit pengembangan AI yang terlihat saat ini bertolak belakang dengan bagaimana teknologi ini dulunya dipikirkan dan diproyeksikan. Lewat arXiv, mereka yang memiliki minat terhadap kecerdasan buatan bisa mengakses semua paper yang tersedia di sana tanpa sensor atau paywall.

Semangat keterbukaan ini membuat paper-paper penting seperti "Deep Residual Learning for Image Recognition" (2015), "Attention Is All You Need" (2017), dan "BERT" (2018) bisa diakses oleh siapa pun. Imbasnya, ilmu dan informasi penting terkait pengembangan AI pun terdemokratisasi secara penuh. Dengan kata lain, arXiv adalah katalisator perkembangan AI era modern karena, dalam sektor ini, kecepatan pembaruan dan kolaborasi adalah kunci, setidaknya sebelum semuanya jadi serba "korporat".

Dari sini, muncul sebuah tanda tanya besar. Apakah etos open-source yang memupuk pertumbuhan AI kini sudah terkooptasi dan kolaborasi telah digantikan oleh kompetisi? Mungkin saja. Akan tetapi, bisa jadi situasi seperti ini tidak akan bertahan selamanya karena, cepat atau lambat, dunia AI akan dihadapkan pada masalah yang jauh lebih genting dari sekadar adu kecanggihan seperti bagaimana menyelesaikan masalah peradaban yang lebih kompleks.

Nah, kendati tren perkembangan dan pengembangan AI menunjukkan deviasi dari semangat yang dipelopori arXiv, bukan berarti keterbukaan lenyap begitu saja dari dunia tersebut. Paper-paper yang ada dalam arXiv, pada dasarnya, tetap menjadi bahan bakar utama. Paper-paper itu tidak cuma digunakan oleh para pengembang yang terafiliasi dengan lab tertentu, tetapi oleh para akademisi, mahasiswa, maupun pemangku kebijakan yang bertugas meregulasi AI.

Artinya, meskipun di permukaan yang tampak adalah kompetisi dan ketertutupan, fondasi sesungguhnya dari AI adalah kolaborasi serta keterbukaan.

Relevansi arXiv di Masa Depan

Meski lebih dikenal luas sebagai katalis pengembangan AI, arXiv sejatinya punya kontribusi besar pula di bidang lain. Sebelumnya sudah disebutkan bahwa ada berbagai disiplin ilmu yang preprint-nya terkumpul di dalamnya. Dan bisa dibilang, popularitasnya sebagai katalis pengembangan AI membuat semakin banyak peneliti yang mempublikasikan preprint mereka di arXiv.

Meski tidak memiliki valuasi miliaran dolar maupun tampilan yang memukau, lalu lintas arXiv senantiasa padat merayap. Jumlah pengunjung yang besar, jumlah submisi paper yang tinggi, itu semua menunjukkan betapa besar kepercayaan dunia akademis kepada platform ini. Meskipun kini website tersebut tak lagi diampu langsung oleh sang pendiri, spiritnya tidak pernah berubah.

Ramin Zabih, sosok yang kini memimpin tim pengampu arXiv, merupakan seorang profesor ilmu komputer yang punya reputasi sebagai pendukung keterbukaan akses informasi. Di bawah asuhan sosok seperti Zabih, masa depan arXiv sebagai platform akademis yang demokratis bakal senantiasa terjaga. Buktinya, pada 2024 lalu, arXiv resmi meluncurkan sebuah platform diskusi terbuka yang diberi nama alphaXiv.

Dalam platform alphaXiv, pembaca bisa memberikan komentar dan catatan secara terbuka terhadap sebuah paper. Cara mengaksesnya pun sangat mudah. Untuk mengubah arXiv menjadi alphaXiv, yang perlu dilakukan hanyalah mengubah tulisan arXiv menjadi alphaXiv pada URL sebuah paper.

Kemunculan alphaXiv sebagai "media sosial" dari arXiv ini semakin mempertegas komitmen para pengampu arXiv serta Cornell University sendiri untuk terus mempertahankan keterbukaan informasi. Dan selama keterbukaan itu terus bisa dipertahankan, arXiv akan selalu menjadi platform paling penting dalam pengembangan kecerdasan buatan dan disiplin ilmu lainnya.

Baca juga artikel terkait ARTIFICIAL INTELLIGENCE atau tulisan lainnya dari Yoga Cholandha

tirto.id - Byte

Kontributor: Yoga Cholandha
Penulis: Yoga Cholandha
Editor: Irfan Teguh Pribadi