Fotografi Komputasi: Tatkala Algoritma Jadi Lensa

Iphone 12 Pro. foto/Apple.com
Oleh: Ahmad Zaenudin - 18 Oktober 2020
Dibaca Normal 5 menit
Rahasia fotografi komputasi: data, data, dan data yang membantu kerja lensa.
“Ketika saya berkarir sebagai sinematografer, semua kamera (yang ada dan yang saya gunakan) bersifat mekanis,” tutur Emmanuel Lubezki, peraih Best Achievement in Cinematography di ajang Academy Awards (Oscar) untuk film Gravity (2013), Birdman (2014), dan The Revenant (2015). Karena kamera yang digunakan bersifat mekanis, lanjut Lubezki, “seorang sinematografer harus memikirkan dan melakukan segala hal teknis terkait pengambilan gambar,” yang tidak mudah dilakukan karena kamera profesional cenderung memiliki berat yang tak main-main dan rumit dioperasikan.

Kelahiran iPhone 12 adalah berkah bagi Lubezki. Ia terpukau oleh kualitas gambar yang dihasilkan iPhone 12--khususnya varian Pro--yang dapat menghasilkan citra berkualitas Dolby Vision. Dengan kualitas yang dihasilkan, ucapnya, "semua pembuat film di seluruh dunia dapat menggunakan iPhone 12 Pro untuk membuat film,” dengan mudah dan murah tanpa perlu memikirkan hal-hal teknik. “Kamera iPhone 12 Pro sangat luar biasa. Kamera ini seperti bisa berpikir,” puji Lubezki.

Pujian Lubezki yang disampaikan dalam acara peluncuran iPhone 12 pada Selasa (13/10) lalu adalah bagian dari strategi pemasaran iPhone yang untungnya tak berlebihan. iPhone 12 memang dapat digunakan baik oleh kalangan profesional maupun amatiran untuk membuat film. Namun, yang perlu diingat, bukan hanya iPhone 12 yang dapat digunakan membuat film. Kamera-kamera yang tersemat dalam ponsel pintar masa kini memang dapat dipakai untuk membuat film. Christopher English, seorang pembuat film amatiran, menggunakan ponsel Google Pixel untuk membuat film pendek berjudul Kepler 22-B dan Revenge. Lalu, sutradara asal Korea Selatan bernama Kim Jee-woon, memanfaatkan Samsung Galaxy S20 dan Note 20 untuk membuat film berjudul Untact.

Sejak Google merilis Pixel generasi pertama pada 2016, kamera yang tersemat dalam ponsel--khususnya pada seri-seri bertitel “flagship"--memang menghasilkan foto/video yang ciamik. Yang patut disimak, iPhone 12 maupun ponsel-ponsel premium lainnya menghasilkan foto/video dengan cara yang sedikit berbeda dibandingkan kamera DSLR maupun mirrorless.

Prinsip Obscura yang Tak Lekang Oleh Waktu

“Kebanyakan kamera yang ada saat ini masih menggunakan prinsip kamera obscura--yang berarti ‘ruang gelap,’ suatu prinsip yang kali pertama dieksplorasi oleh filsuf Cina di abad ke-5 sebelum masehi,” tutur Shree K. Nayar, pengajar Ilmu Komputer pada Columbia University, dalam studi berjudul “Computational Cameras” yang dipaparkan dalam Conference Vision Applications, Mei 2007 silam di Tokyo, Jepang.

Kamera obscura menggunakan lubang di salah satu dinding ruang untuk menghasilkan gambar. Melalui lubang tersebut, cahaya masuk dan seakan memancarkan bentuk gambar di dinding yang kedua. Ya, obscura tak ubahnya sebuah kamera pinhole. Di awal penemuan prinsip ini, seniman melukis di dinding yang terkena paparan cahaya, tak ubahnya seniman digital tatkala melakukan tracing melalui Photoshop.

Lalu lahirlah lensa, sebuah alat optik yang dapat membuat cahaya terorganisir, terpusat, dan akhirnya mampu mempertajam gambar. Merujuk Marc Levoy, Profesor Ilmu Komputer pada Stanford University, dalam studinya berjudul “Experimental Platforms for Computational Photography” (2010), seorang bernama Joseph Nicéphore Niépce melakukan terobosan pada prinsip obscura pada 1820an. Alih-alih menggunakan dinding untuk menghasilkan gambar--yang membutuhkan tangan seniman untuk menghasilkan gambar sesungguhnya--Niépce menembakkan dan merekam cahaya ke medium yang sensitif cahaya, yakni plat tembaga. Di kemudian hari, plat digantikan oleh film.

Terobosan selanjutnya di dunia teknologi terjadi pada 1970-an. Kala itu, Willard Boyle dan George E. Smith menemukan sensor digital peka cahaya bernama charge-coupled device (CCD). Sayangnya, sebagaimana dilaporkan James Estrin untuk The New York Times, CCD memiliki kelemahan: gelombang elektronik yang tertangkap sensor ini mudah hilang. Walhasil, CCD sukar disetel sebagai sensor kamera. Beruntunglah, karyawan baru Kodak bernama Steven Sasson memperbaiki kelemahan CCD. Melalui tangan Sasson, cahaya yang mengenai tubuh CCD yang berjenis elektronik diubah menjadi angka/binari, 0 atau 1. Angka-angka itu kemudian disimpan ke dalam RAM dan ditaruh secara permanen pada pita magnetik digital.


Pada 1975, Sasson akhirnya menciptakan kamera digital pertama di dunia, Rube Goldberg.

Dalam laporan berjudul “Computational Photography” yang terbit di American Scientist Volume 96 (2008), Brian Hayes menyatakan fotografi digital tak pernah meninggalkan prinsip obscura terlepas dari besarnya terobosan kamera digital. Cara kerjanya masih sama saja. Namun, yang patut ditelisik lebih lanjut, ada kerja komputer yang dilakukan kamera digital untuk menghasilkan foto. Sensor peka cahaya yang tersemat dalam kamera digital terbentuk dari sekumpulan persegi, atau lazim disebut piksel. Masalahnya, piksel-piksel itu tidak menangkap semua warna, melainkan hanya RGB alias merah (red), hijau (green), dan biru (blue) sebagai warna dasar. Untuk menghasilkan warna yang sesuai dengan kenyataan, komputer yang tersemat dalam kamera pun bekerja. Melalui sensor peka cahaya tersebut, komputer mengukur seberapa kuat intensitas cahaya yang mengenai sensor. Dengan algoritma khusus, ia akhirnya menciptakan warna.

Kamera digital, tegas Hayes, sesungguhnya “tidak mengambil foto, melainkan menciptakan foto.” Dan kamera digital melakukan proses komputer yang terbilang sederhana untuk “menciptakan” foto.

Proses ini pun dilakukan oleh kamera yang tersemat di dalam ponsel. Sayangnya, bentuk atau form factor ponsel kecil pada akhirnya menghadirkan kelemahan dalam membuat foto/video, wabilkhusus karena sensor yang dapat disematkan dalam ponsel. Kamera DSLR atau mirrorless bertitel “full-frame” memiliki sensor sebesar 35x24 milimeter. Sementara itu, kamera bertitel “APS-C” memiliki sensor yang menciut 1,52 kalinya full-frame, yakni sebesar 23,6x15,6 milimeter. Di sisi lain, sensor peka-cahaya yang termuat dalam ponsel ukurannya berada di kisaran 6,17x4,55 milimeter.

Besar-kecilnya sensor berpengaruh terhadap kuantitas cahaya yang bisa masuk dan akhirnya kualitas gambar. Dengan hanya melihat ukuran sensor, foto/video yang dihasilkan kamera ponsel tak akan sebagus DSLR atau mirrorless. Awalnya, untuk mengakali kelemahan ini, produsen-produsen ponsel memilih untuk memperbesar piksel. Tentu, dengan cahaya yang terbatas, piksel yang besar tak terlalu berpengaruh pada kualitas foto yang dihasilkan. Maka, produsen ponsel memilih jalan lain agar kamera yang tertanam dalam ponsel menghasilkan gambar yang berkualitas. Alih-alih memerintahkan sensor untuk menghasilkan gambar, mereka memaksa prosesor untuk melakukannya--jauh lebih kompleks dibandingkan yang telah dilakukan kamera digital biasa.

Lalu lahirlah computational photography atau fotografi komputasi.

Tatkala Algoritma Menjadi Lensa

Fotografi adalah proses “menggambar dengan cahaya” untuk menghasilkan foto. Masalahnya, dengan form factor yang terbatas, kamera ponsel sukar melakukan proses ini. Dengan form factor terbatas, kamera ponsel akhirnya memiliki sensor peka-cahaya yang terbatas pula. Pun, dengan alasan yang sama, kamera ponsel tidak dapat melanggar hukum fisika untuk menempatkan lensa yang bertenaga. Maka, sebut Yael Pritch Knaan, ilmuwan Google yang telah menghasilkan 50 studi tentang fotografi, untuk menghasilkan foto/video yang bagus dari kamera ponsel, “alih-alih memperlakukan piksel selayaknya sebuah piksel, kami mencoba memahami apa sesungguhnya piksel.” Alih-alih memotret foto hanya melalui cahaya, kamera ponsel--khususnya yang tersemat pada ponsel premium--melakukan proses fotografi komputasi untuk menghasilkan foto/video.



Marc Levoy, dalam “Experimental Platform for Computational Photography” menyebut bahwa fotografi komputasi merupakan proses di dalam aplikasi kamera ponsel untuk menghasilkan foto yang lebih menekankan kekuatan prosesor, machine learning, serta algoritma alih-alih sensor peka cahaya dan lensa. Yang jelas, proses ini bukan memodifikasi foto yang sudah jadi seperti yang dilakukan melalui filter-filter Instagram. Pertama-tama, cahaya yang ditangkap sensor peka cahaya kamera ponsel tidak lantas menjadi hasil utuh, melainkan diolah sebagai data untuk diproses. Tentu, tak hanya satu data. Untuk menghasilkan foto/video berkualitas, diperlukan data yang beragam dan banyak.

Pada kasus iPhone 12 Pro, misalnya, data yang beragam dihasilkan melalui tiga modul kamera ponsel yang tersemat di dalamnya, dengan lensa berbeda-beda. iPhone 12 Pro memiliki lensa ultrawide, wide, dan telephoto dengan masing-masing memanfaatkan resolusi sebesar 12 megapiksel. Tak ketinggalan, untuk memahami objek yang hendak dipotret, iPhone 12 Pro menyematkan LiDAR, dan dalam kasus ponsel lain, menggunakan infra red. Lalu, ketika tombol rana ditekan, kumpulan modul kamera dengan ragam lensanya dan modul tambahan itu tak hanya memotret sekali, melainkan berkali-kali--secara otomatis, tanpa disadari pengguna--alias “burst of images.” Data-data yang diperoleh ini dialirkan pada RAM yang ada di ponsel untuk diproses prosesor. Secara spesifik, ponsel-ponsel premium memiliki chip khusus untuk memproses data ini. Pada iPhone 12, perangkat ini memiliki Smart HDR 3 yang tertanam di A14 Bionic. Pada Pixel, Google menyematkan Pixel Visual Core (PVC).



Ketika data diterima chip khusus itu, machine learning dan algoritma bekerja. Sebagaimana disebut Knaan, di titik ini, chip dan algoritma berusaha keras memahami apa sesungguhnya data dari piksel-piksel sensor peka-cahaya itu. Akhirnya, potret yang kualitasnya tak kalah dengan DSLR lahir. Disuguhkan pada pengguna sebagai foto/video utuh.

Dalam studi berjudul “Google’s Lens: Computational Photography and Platform Capitalism,” Sy Taffel menjelaskan bahwa tatkala aplikasi kamera yang terpasang di Pixel dibuka, aplikasi tersebut langsung memotret, tanpa diketahui pengguna. Ketika akhirnya pengguna menekan tombol potret, aplikasi telah bekerja setengah jalan untuk urusan memotret. Catat Taffel, sebelum pengguna menekan tombol untuk memotret, aplikasi telah memotret sebanyak 15 kali, dan ketika pengguna menekan tombol, aplikasi memotret 15 kali lagi. Untuk membuat pengguna tidak menunggu lama melihat hasil, ketika aplikasi memotret diam-diam Pixel langsung melakukan proses komputasinya. Mirip sebagaimana kita menonton video di Youtube, di mana frame-frame selanjutnya telah dipancarkan bahkan sebelum kita sampai di frame tersebut.

Knaan, dalam “Sky Optimization: Semantically Aware Image Processing of Skies in Low-Light Photography” (2020) menyebut, dalam beberapa kasus, produsen ponsel telah membuat suatu basis data untuk objek-objek tertentu untuk mempermudah kerja ponsel menghasilkan foto/video berkualitas. Langit, misalnya. Pada Pixel, Google memiliki basis data yang besar terkait foto langit. Ketika pengguna memotret objek berlatar belakang langit, Pixel akan mengisolasi objek dan latar belakang langit itu. Langit diproses tersendiri. Memanfaatkan machine learning, Pixel mencoba memahami langit yang terpotret oleh penggunanya dengan langit di basis data yang ada. Hasilnya, entah siang atau malam, Pixel sukses menghasilkan foto berlatar belakang langit yang ciamik.

Dengan fotografi komputasi, ponsel perlahan mengikis ketertinggalannya dari kamera DSLR atau mirrorless.

Tentu, fotografi komputasi tidak mendadak lahir tatkala Google memperkenalkan Pixel atau Apple memperkenalkan iPhone. Konsep fotografi komputasi telah ada semenjak dunia fotografi mengenal foto high dynamic range (HDR). Sementara itu, cikal bakal fotografi komputasi pada ponsel sudah lahir pada 2007. Kala itu, merujuk Kari Pulli dalam “Mobile Computational Photography with FCam” (2014), sebuah tim gabungan Nokia Research center dan Stanford University, menciptakan Frankencamera saat mencoba mengatasi keterbatasan kamera ponsel.

Ya, nama Frankencamera memang diambil dari monster Frankenstein, karena kamera ini mengambil dan mencampurbaurkan pelbagai modul untuk menciptakan gambar berkualitas dari berbagai alat. Fondasi Frankencamera sudah terpasang dalam tubuh Nokia N95. Para peneliti mengutak-atik N95, menambahinya algoritma khusus, modul kamera tambahan (atau digabungkan dengan unit N95 lain), flash, dan lain sebagainya, sebagai sumber data yang berbeda untuk menghasilkan satu foto utuh. Berkat penelitian inilah perlahan algoritma dan aplikasi akhirnya dapat menjadi lensa.

Baca juga artikel terkait FOTOGRAFI atau tulisan menarik lainnya Ahmad Zaenudin
(tirto.id - Teknologi)

Penulis: Ahmad Zaenudin
Editor: Windu Jusuf
DarkLight