Những năm gần đây, Machine Learning và Data Mining đang trở thành một trào lưu khá hot. Những công việc liên quan đến data ra đời, trong đó có Data Scientist và Data Engineer.
Nghe giang hồ đồn đại rằng đây là những công việc khá khó, chỉ các công ty lớn mới tuyển với mức lương rất khủng. Tuy vậy, phần lớn chúng ta (trong đó có mình) vẫn chưa thật sự hiểu về công việc này.
Kì này, do cơ duyên xảo hợp nhờ la cà quán nhậu, mình có năn nỉ dụ dỗ phỏng vấn được anh Trần Duy Cảnh, hiện đang là Data Scientist tại công ty Yokogawa ở Singapore.
Không chỉ có tấm bằng Master ngành Knowledge Engineer tại Đại học danh tiếng NUS – National University of Singapore (Đại học Ranking số 1 châu Á và thứ 15 toàn cầu), anh còn giữ vị trí đại điện cho Institute of Systems Science tại Đại Học này trong tận 1 năm.
Trái ngược với học vị hầm hố, đại ca Cảnh Trần (not Truồng) ngoài đời rất cute và dễ gần. Cùng nghe anh Cảnh chia sẻ về kinh nghiệm của bản thân, và con đường từ Web Developer trở thành Data Scientist nhé.
1. Mặc dù e đã giới thiệu sơ sơ rồi, anh có thể giới thiệu lại về bản thân (tên tuổi, công việc hiện tại, kinh nghiệm, sở thích) cho bạn đọc biết được không?
Xin chào bà con cô bác, 500 ace code dạo, mình tên Cảnh. Hiện tại mình đang là Data Scientist của tập đoàn tự động hóa Yokogawa – Singapore.
Về kinh nghiệm thì mình mới có 26 cái xuân nên cũng không có gì nhiểu, chủ yếu cờ bạc gái gú rượu chè =)))
Trước khi chính chính thức chuyển qua làm dữ liệu thì mình là một thằng dev, chuyên code PHP và Ctrl+C, Ctrl+V HTML, JS….
Sở thích thì mình hầu như cũng giống ace code dạo, ăn ngủ, chơi Dota (tự hào 2k mmr, team nào cần cho mình vào feed to TI). Ngoài ra thì mình còn tham gia Kaggle (Kaggle là gì thì các bạn đọc phần dưới nha), tìm hiểu viết mấy con AI vớ vẩn.
2. Quá trình đi làm của anh cũng có khá nhiều điều thú vị ha. Anh có thể chia sẻ thêm với mọi người về quá trình làm việc từ lúc làm Web Developer, làm free lancer, tới lúc qua Singapore học Master và thành Data Scientist được không?
Mình tốt nghiệp tại đại học Tôn Đức Thắng, khóa 13. Sau khi tốt nghiệp thì mình làm freelancer và tham gia start-up, con đường cũng chông gai lên xuống, đến khi hết tiền mình về đầu quân cho công ty của Úc tại Việt Nam GO1, được mấy anh trong công ty chỉ bảo tận tình mình “tấn phong” lên 1 tầng cao mới, công lực dồi dào hơn =))) (các đại ca có đọc được đừng chém em nhá ).
Dạo đó mình có tìm hiểu về Data và bắt đầu hứng thú với AI, nên mình quyết định bỏ hết mọi thứ, sang Singapore học Master (hên là đc NUS gọi) và trở thành Data Guy
3. Ngành Data Scientist là ngành còn khá “mới”, ít người biết. Anh có thể giới thiệu cho mọi người biết sơ về ngành này, cũng như công việc thường ngày của anh là gì không ạ?
Về ngành này thì trên mạng chắc có nhiều rồi, nên mình cũng không đưa khái niệm. Nói đơn giản Data Scientist là thu thập dữ liệu, và tìm ra những thông tin tiềm ẩn, có giá trị trong đó -insight (kiểu như tìm mật tịch hoặc bí kíp võ công trong hoang mạc ấy). Từ những thông tin đó, giải thích cho các bên liên quan, sau đó chuyển hóa những thông tin quan trọng đó sản phẩm hoặc hành động nào đó.
Ví dụ như về marketing, sau khi tìm thấy những thông tin quan trọng, họ có thể dùng thông tin đó để áp dụng cho những campaign marketing sau này.
Hoặc về chứng khoán, dựa vào những insights, họ có thể phân tích và xây dựng hệ thống dự đoán cổ phiếu (prediction system), tỉ lệ xác xuất chỉ cần 30% có thể coi là thành công =))
Thật ra Data Scientist tùy theo khái niệm của công ty, nhìn chung mình phân ra làm 2 loại, tạm gọi là Data Scientist A và Data Scientist B
- Data Scientist A: Những người có background về Statistics, Economics. Công việc thường ngày của họ là phân tích dữ liệu, tìm ra insights, visualisation và sau đó trình bày cho các bên liên quan.
- Kỹ năng cần phải có là Data Mining, SQL, Python/R, Visualisation tools như Tableau, QlikView, D3js và quan trọng nhất là kĩ năng thuyết trình. (Code có thể xấu, nhưng họ phải giải thích được cho người khác hiểu về insights và thuật toán)
- Data Scientist B: Thiên về software engineer, ngoài việc nắm vững phân tích dữ liệu, công việc thường ngày của họ còn có xử lý / lưu trữ dữ liệu, viết thuật toán để xây dựng hệ thống, sản phẩm data cho công ty.
- Về kĩ năng thì các bạn có thể tổng hợp cái đống ở trên và thêm vào kiến thức về Software Engineer như OOP, micoservices, buiding products/services/api, data architect, data pipeline…
Mình thì thuộc về nhóm B, nên công việc của mình thì giống như vậy, hầu như mình dành nhiều thời gian nhất để tranh luận với team về thuật toán, trước khi tranh luận mình đều phải tự mình đưa ra giả thuyết (hypothesis), viết code áp dụng thuật toán để chứng minh giả thuyết của mình đúng.
Trong team của mình, thì ngoại trừ mình tất cả còn lại đều thuộc nhóm A, một số bạn còn có bằng tiến sĩ (PhD) nên họ rất vững về lý thuyết, áp dụng thuật toán vào data.
Sau khi đưa đến kết luận cuối cùng, mình mới bắt đầu dành thời gian để viết services. Thường thì mình chỉ viết Rest API để back-end team có thể gọi và sử dụng engine.
Vd như sản phẩm hiện tại mình đang làm là một hệ thống dự đoán tỉ lệ rủi ro của dàn khoan dầu khí khi một thiết bị gặp sự cố.
4. Tại sao anh lại đến với ngành lập trình này? Cơ duyên nào để anh chuyển từ Web Developer sang Data Scientist vậy ạ?
Mình cũng không biết là cơ duyên nào, lúc đó mình chỉ thấy là Data và AI có vẻ thú vị, cộng thêm nộp đơn thử vào NUS, ai ngờ lại đậu nên quyết định đi học luôn.
Học xong thì mình quyết định chuyển hoàn toàn sang mảng Dữ liệu.
5. Giữa làm Developer và làm Scientist anh thích cái nào hơn? Làm cái ngành Data Scientist này có gì “vui” và “sướng” hơn làm developer không ạ?
Như mình đã đề cập ở trên, mình là Data Scientist loại B, nên cũng có thể coi như là 1 developer hoặc machine learning engineer. Công việc thì giống như developer thêm phần đi họp và chém gió chứ viết code thì cũng không khác nhau.
Nói về “vui” và “sướng” chắc là lúc thấy hệ thống dự đoán đúng mà mình cũng không hiểu tại sao nó dự đoán đúng được như vậy =)) (cảm giác như vừa tạo ra kì tích đột biến ngàn năm có một!).
6. (Câu hỏi bạn đọc) Làm Data Scientist và Data Engineer cần những kĩ năng và tố chất gì ạ? Có cần phải học để lấy bằng Master không anh?
Thật sự thì Data Scientist và Data Engineer là 2 lĩnh vực khác nhau. Để trở thành Data Scientist / Data Engineer về lý thuyết thì không cần lấy bằng Master. Nhưng đa phần các công ty đều khuyến khích Data Scientist phải có ít nhất là bằng Master, PhD càng tốt.
Lý do tại sao thì do mình nghĩ rằng khi trở thành Data scientist, trong qua trình làm việc sẽ đọc rất nhiều papers. Mà một paper thì rất là khó nuốt toàn là công thức toán và khái niệm trên trời và quan trọng làm sao bạn có thể áp dụng được những nghiên cứu trong paper ra thực tiễn. (Đây không phải là việc dễ dàng).
Hầu như những người học Master hay PhD ở Singapore trong quá trình học đều đọc và áp dụng rất nhiều paper. Còn về tố chất để trở thành Data Scientist thì mình nghĩ rằng chỉ cần bản thân có đam mê là đủ.
7. (Câu hỏi bạn đọc) Em thấy ở Việt Nam tuyển Data Scientist khá ít nên sợ khó tìm việc. Ở nước ngoài họ có tuyển nhiều không anh? Những công ty nào tuyển ạ? Họ phỏng vấn và làm test ra sao anh?
Mình chỉ làm việc tại Singapore nên không rõ nước khác, nhưng hiện tại nhu cầu tuyển dụng Data Scientist ở Sing khá lớn, hầu như cung không đủ cầu, đặc biệt là những Data Scientist có kinh nghiệm.
Một số công ty tiêu biểu có thể Lazada (team data có khoảng 20+ người), SAP, Accenture, (2 công ty này tuyển rất nhiều data scientists), ngoài ra còn có Microsoft, Amazon,.….. Về Việt Nam thì mình cũng nhận được contact từ Viettel và VNG cũng đang tuyển Data Scientist.
Đa phần về Data Scientist Interview, mình ấn tượng nhất là 2 công ty mình đã tham gia phỏng vấn và failed đó là Ahref và SAP.
Về SAP, họ hỏi mình đủ thứ trên trời dưới đất, khi mình đề cập đến bất cứ 1 khái niệm về machine learning hay algorithm nào, họ lập tức hỏi về nó, yêu cầu giải thích rõ ràng về định nghĩa, áp dụng và công thức. Sau đó họ còn bắt mình code whiteboard một cái machine learning library và chỉ được sử dụng basic python.
Còn Ahref thì hiện tại công ty này đang nghiên cứu về reverse-engineer Google rank page algorithm, nên bài test đưa ra liên quan một phần nhỏ đến vấn đề này. Đương nhiên là trình của mình chưa làm được =))
8. Trong quá trình học tập và làm việc bên xứ người, chắc cũng có nhiều cái sướng cũng như nhiều cái vất vả nhỉ nhỉ? Anh chia sẻ thêm về những những cái sướng cái khổ nơi xứ người với các bạn sinh viên được không?
Sướng là không khí trong lành, hệ thống phúc lợi xã hội, hỗ trợ tốt chỉ cần học và làm việc không cần lo nghĩ nhiều. Đồng nghiệp là đa quốc tịch nên có cơ hội giao tiếp và biết đến nhiều nên văn hóa khác nhau.
Khổ là bia, rượu mắc quá, muốn uống nhiều cũng không được :)). À còn một cái khổ nữa là suốt 2 năm học tại NUS mình xuống hơn 5kg, về nhà ba má nhận không ra :((
9. Bản thân anh thấy môi trường làm việc ở Singapore có gì hay và dở hơn Việt Nam không? Anh cảm thấy thích thú với điều gì nhất? (Có trải nghiệm gì hay ho thì anh chia sẻ cũng được).
Cái này thì mình để thằng code dạo trả lời, hình như hắn viết hẳn 2 bài về vấn đề này =))).
10. (Câu hỏi bạn đọc) Em đã đi code một thời gian. Giờ em muốn chuyển qua làm Data Scientist thì nên bắt đầu như thế nào ạ? Anh có thể chỉ cho em lộ trình học được không?
Đầu tiên mình nghĩ bạn cần nắm về machine learning và algorithm, bạn có thể bắt đầu bằng các khóa học trên mạng. Mình recommend khóa học Machine Learning của Andrew Ng, khóa học này được coi là kinh thánh cho data scientist.
Sau đó bạn có thể bắt đầu với Python hoặc R và tham gia challenge trên Kaggle. Kaggle là một platform để Data Scientist tham gia, kiếm tiền thưởng và cạnh tranh thứ hạng với nhau. Nhiều người cũng nói với mình Kaggle là con đường tốt nhất và ngắn nhất để đến với Data Science.
11. Câu cuối anh nhé! Anh có lời khuyên gì dành cho các bạn sinh viên ngành IT và các bạn developer muốn theo ngành Data Scientist không?
Cho dù các bạn muốn làm dev hay data, quan trọng nhất vẫn là đam mê, có đam mê, con đường ngắn nhất lên “đỉnh”, “sung sướng” sẽ mở ra cho bạn =))
P/S: Cám ơn anh Cảnh rất nhiều về cuộc phỏng vấn trao đổi này. Nếu có thắc mắc gì, các bạn cứ thoải mái comment vào bài viết hoặc hỏi trực tiếp anh Cảnh nhé.