Kenalan Dengan Profesi Milenial Saat Ini: Data Scientist, Data Engineer Dan Data Analyst.

Missing File
Dec
07

Seiring populernya big data di dunia kerja, memunculkan banyak cabang pekerjaan baru. Ilmu data merupakan bidang yang popular saat ini dimana hampir seluruh perusahaan mempekerjakan seorang ilmuan data untuk mengetahui masalah secara rinci dan jelas.

Data merupakan sebuah hal yang amat sangat penting bagi proses yang terjadi dalam bisnis. Dengan besarnya pertumbuhan data setiap harinya di era digital saat ini, tidak mungkin seluruh data tersebut hanya disimpan pada suatu sistem yang tradisional, maka solusi yang tepat yaitu menggunakan big data solution agar data dapat dikumpulkan secara terstruktur. Oleh sebab itu Banyak perusahan teknologi di Indonesia yang membutuhkan profesi ini untuk menjadi bagian dari perusahaannya.

Lalu yang menjadi pertanyaan bagaimana deskripsi kerjanya, apa saja yang harus dikuasai, dan sebagainya ?
 Berikut ini ulasannya

1. Data Engineer

Deskripsi pekerjaan: orang yang membangun infrastruktur yang berhubungan dengan volume data yang besar, yaitu seluruh data yang dapat berguna untuk diambil datanya tapi masih tidak beraturan (tidak terstruktur). Itu berarti memastikan bahwa data dikumpulkan dan diambil secara efisien dari sumbernya saat diperlukan, dibersihkan, dan diproses sebelumnya.

Mengapa ini penting: Jika Anda hanya pernah bekerja dengan dataset yang relatif kecil (kurang dari 5 GB) yang disimpan dalam file .csv atau .txt, mungkin akan sulit untuk memahami mengapa ada orang yang pekerjaan penuh waktunya dalam membangun dan memelihara jaringan data.

Berikut beberapa alasan:

  1. Dataset 50 GB tidak akan muat dalam RAM komputer Anda, jadi Anda biasanya membutuhkan cara lain untuk memasukkannya ke dalam model Anda
  2. Banyak data dapat memakan waktu yang sangat banyak untuk diproses dan seringkali harus disimpan secara berlebihan. Mengelola penyimpanan itu membutuhkan pengetahuan teknis khusus.

Persyaratan: Teknologi yang akan gunakan Apache Spark, Hadoop dan / atau Hive, serta Kafka. Selalin itu, harus memiliki fondasi yang kuat dalam SQL.

Pertanyaan yang akan Anda hadapi nantinya seperti:

  • Bagaimana cara membangun saluran data yang dapat menangani 10.000 permintaan per menit?
  • Bagaimana saya bisa membersihkan dataset ini tanpa memuat semuanya dalam RAM?

2. Data Analysis 

Deskripsi pekerjaan: Menerjemahkan data menjadi wawasan bisnis yang dapat ditindaklanjuti. Anda akan sering menjadi perantara untuk tim teknis dan strategi bisnis, penjualan, atau tim pemasaran. Visualisasi data (baik dalam bentuk grafik maupun tabel) sesuai dengan kebutuhan para pimpinan. Laporan tsb akan dijadikan referensi utama bagi para pemimpin dalam mengambil kebijakan untuk mengarahkan perusahaan.

Mengapa ini penting: Orang yang sangat teknis sering mengalami kesulitan memahami mengapa analis data sangat penting, tetapi memang benar. Seseorang perlu mengonversi model yang terlatih dan teruji dan gundukan data pengguna ke dalam format yang mudah dicerna sehingga strategi bisnis dapat dirancang di sekitar mereka.

Analis data membantu memastikan bahwa tim sains data tidak membuang waktu mereka memecahkan masalah yang tidak memberikan nilai bisnis.

Persyaratan: Teknologi yang akan Anda gunakan termasuk Python, SQL, Tableau, dan Excel. Anda juga harus menjadi komunikator yang baik.

Pertanyaan yang akan Anda hadapi nantinya seperti:

  • Apa yang mendorong angka pertumbuhan pengguna kami?
  • Bagaimana kami menjelaskan kepada manajemen bahwa kenaikan biaya pengguna baru-baru ini membuat orang menjauh?

3. Data Scientist

Deskripsi pekerjaan:  Mengolah lebih lanjut data yang telah dikumpulkan oleh data engineer. Mulai dari data extraction, lalu data preparation (cleansing), data processing, dan analysis. Data scientist perlu memastikan kondisi data baik dan sesuai untuk dianalisis dan diambil insightsnya. Data scientist biasanya melakukan eksperimentasi dengan menggunakan teknik machine learning dan metode statistik untuk digunakan dalam pemodelan prediktif dan preskriptif.

Mengapa ini penting: Ketika Anda memiliki setumpuk data yang terlalu besar bagi seorang manusia untuk mengurai dan terlalu berharga untuk diabaikan, Anda perlu beberapa cara menarik wawasan yang dapat dicerna darinya. Itulah pekerjaan dasar dari seorang ilmuwan data: mengombinasikan beberapa pasang data untuk mengungkap suatu pola. Contohnya, kebiasaan dan preferensi konsumen. Pola yang dicari ini nantinya dapat digunakan sebagai acuan untuk memprediksi pergerakan bisnis suatu produk.

Persyaratan: Teknologi yang akan Anda gunakan termasuk Python, scikit-learn, Pandas, SQL, dan mungkin Flask, Spark dan / atau TensorFlow / PyTorch. Beberapa posisi ilmu data murni teknis, tetapi mayoritas akan mengharuskan Anda untuk memiliki beberapa naluri bisnis sehingga Anda tidak akan menyelesaikan masalah yang tidak dimiliki oleh siapa pun.

Pertanyaan yang akan Anda hadapi nantinya seperti:

  • Berapa banyak jenis pengguna yang berbeda yang benar-benar kita miliki?
  • Bisakah kita membangun model untuk memprediksi produk mana yang akan dijual kepada pengguna mana?

Skill that you must have as Data Scientist, Data Analyst or Data Engineer 

Ketiga uraian pekerjaan diatas tidak berdiri sendiri dalam semua kasus. Pada startup tahap awal, misalnya, seorang ilmuwan data mungkin harus menjadi insinyur data dan / atau analis data. Tetapi sebagian besar pekerjaan akan jauh lebih rapi ke dalam salah satu kategori ini daripada yang lain. Dan semakin besar perusahaan, maka semakin banyak kategori ini dibutuhkan.

Orang-orang bekerja dalam mengolah data tidak boleh kehilangan fokus karena akan berakibat fatal dan tentu hal ini merupakan pekerjaan sulit. Sebagai contoh, beberapa perusahaan menerapkan model sederhana untuk dataset yang besar, beberapa menerapkan model yang kompleks untuk dataset kecil, beberapa melatih model mereka dengan cepat, dan beberapa tidak menggunakan model (konvensional) sama sekali.

Menjadi ilmuan data perlu menyajikan data dilengkapi dengan pemaparan yang jelas untuk membantu pengambilan keputusan. Perlu diketahui profesi ini dapat dibilang langka karena kurangnya talenta yang ada di Indonesia. Ayo raih kesempatanmu untuk menjadi seorang data scientist, data analysis atau data engineer.

Sumber: Medium, Tech in Asia

Editor: Mega Herdiyanti