Mencoba Deep Learning dengan Setup Minimal
Mau belajar deep learning tapi gak punya GPU kompatibel? Mau belajar deep learning tapi pusing setup environment-nya? Mau coba Hello world di salah satu...

Mau belajar deep learning tapi gak punya GPU kompatibel? Mau belajar deep learning tapi pusing setup environment-nya? Mau coba Hello world di salah satu framework deep learning tapi install dependencies-nya aja gak berhasil?
Salah satu masalah ketika akan memulai untuk belajar deep learning adalah ketika menyiapkan environment-nya. Seringkali kita dipusingkan berhari-hari hanya untuk instalasi dan setup environtment yang kita butuhkan untuk sebuah framework deep learning, sehingga energi kita habis dan menyerah bahkan sebelum mencoba menulis Hello World. Oleh karena itu Jeremy Howard (fast.ai) menyarankan siswanya untuk menggunakan template Virtual Machine (VM) pada salah satu cloud service dalam course-nya, agar siswa fokus pada pembelajaran deep learning-nya.
Pada posting kali ini kita akan membahas beberapa cara yang relatif sederhana untuk yang ingin mencoba memulai deep learning tanpa harus repot setup environment dari awal. Here we go!
1. Pre-Configured VM
Cara sederhana pertama untuk mencoba deep learning adalah dengan menggunakan VM images yang telah di-setup sebelumnya. Salah satu yang bisa kita coba adalah VM images pada medium post ini. Caranya cukup sederhana, kita tinggal:
- Download dan install VMware
- Download Pre-configured VM Image-nya
- Buka VMware, load VM Image yang telah di download, dan Run VM-nya
Maka VM kita akan boot dengan Linux VM yang siap digunakan. VM tersebut sudah di-setup dengan:
- Ubuntu 16.04 LTS
- Python 3.5
- Tensorflow 1.5
- Keras 2
- OpenCV 3.2 dengan Python binding
- dan beberapa package lain untuk computer vision dan machine learning
Kekurangan dari cara pertama ini adalah masih memakai CPU version. Dikarenakan lisensi dan komplikasi instalasi, GPU support tidak disediakan.
2. Paperspace
Paperspace merupakan penyedia layanan cloud computing yang berfokus pada komputasi GPU. Mereka menyediakan layanan untuk virtual desktop, virtual workstation untuk me-render visual effect, gaming, dan dalam kasus kita: machine learning. Pricing yang ditawarkan cukup kompetitif dengan layanan cloud computing lain semacam AWS (tentunya yang sama-sama GPU), tetapi dengan kemudahan setup di awal (framework seperti Tensorflow, Torch, Caffe, dan Keras sudah pre-installed).
Karena kemudahan inilah fast.ai menyarankan siswanya untuk menggunakan layanan dari paperspace, agar siswa course tersebut bisa fokus pada pembelajaran deep learningnya, bukan pada setup-nya. Untuk yang mengikuti course dari fast.ai, tersedia template VM khusus yang telah terinstall library yang dibutuhkan untuk course tersebut.
Kekurangan dari cara ini adalah berbayar ;)
3. Google Colaboratory
Google colab merupakan tool untuk edukasi dan riset machine learning dari Google. Tool ini menyediakan komputasi cloud baik berupa CPU maupun GPU secara GRATIS. Tools ini berupa Jupyter environment, yang tidak membutuhkan setup untuk digunakan.
Saat ini, google menyediakan VM dengan spesifikasi sbg berikut:
- CPU: Intel Xeon @ 2.20 GHz
- Memory: 13GB RAM
- GPU: NVidia Tesla K80, dengan 11GB Memory
Walaupun interface yang disediakan berupa jupyter notebook, kita masih bisa menginstall library lain yang kita butuhkan dengan menuliskan tanda seru (!) sebelum perintah command line, sebagai contoh:
1
!pip install keras
Tool ini bisa digunakan bersamaan dengan google drive untuk penyimpanan datanya (colab notebook pun nantinya akan tersimpan di google drive). Tetapi untuk memakai dataset yang tersimpan di google drive, dibutuhkan library lain (Drive Fuse) untuk diinstall terlebih dahulu. Untuk cara setup google colab dapat dilihat di artikel ini atau ini.
Kekurangan dari google colab sendiri adalah maksimum penggunaan satu instance secara continuous adalah 12 jam, dan ketika lewat dari itu maka akan dipindahkan ke instance lain yang menyebabkan kita harus menginstall kembali library tambahan yang kita butuhkan. Tapi menurut saya hal tersebut bukan masalah besar, terutama untuk belajar, mengingat layanan ini tidak berbayar sama sekali alias gratis. Jika kita menggunakan paperspace untuk mentraining model selama 12 jam, dengan GPU yang sama, maka akan dikenakan biaya sebesar $12 ($1/hr untuk K80), ditambah $5 untuk biaya penyimpanan perbulan.
Kesimpulan
Tiga cara diatas adalah sebagian contoh tools yang bisa kita gunakan untuk mencoba deep learning tanpa harus repot dengan setup di awal. Menurut saya tools terbaik dari ketiga tools di atas adalah Google colab. Kita bisa mendapatkan VM dengan computing power yang lumayan secara gratis. Jika anda mempunyai budget untuk sewa cloud computing, paperspace bisa menjadi pilihan, apalagi jika anda sudah membutuhkan training data yang lebih lama dari 12 jam atau membutuhkan GPU yang lebih cepat. Pre-configured VM pada cara pertama dapat digunakan jika anda ingin bisa mengakses VM-nya tanpa koneksi internet.