I. Data Science, công việc hấp dẫn nhất thế kỷ 21
Trong thế giới mà mọi thứ dựa trên dữ liệu, các Data Scientist (nhà khoa học dữ liệu) nổi lên như một mặt hàng nóng hổi mà nhà nhà, người người săn tìm. Các cuộc tìm kiếm, tranh giành nhân tài trong lĩnh vực Data Science đã bắt đầu. Các chuyên gia ước tính rằng hàng triệu việc làm về Data Science có thể vẫn còn trống vì thiếu nhân sự. Tìm kiếm các Data Scientist trên toàn cầu không chỉ đơn thuần là tìm kiếm nhân sự trong lĩnh vực thống kê (statisticians) hoặc khoa học máy tính (computer scientist). Trên thực tế, các công ty đang tìm kiếm những nhân sự đáp ứng được các kỹ năng như:
- Có chuyên môn trong một lĩnh vực bất kỳ
- Một số kinh nghiệm trong lập trình phần mềm (Software Engineering)
- Kỹ năng phân tích
- Kỹ năng giao tiếp, kể chuyện
Kỹ thuật số đã thay đổi cuộc sống của chúng ta một cách nhanh chóng trong 10 năm qua. Dung lượng kỹ thuật số khoảng 130 tỷ gigabyte vào năm 1995. Đến năm 2020, con số này sẽ tăng lên đến 40.000 tỷ gigabyte (gấp hơn 300 lần hiện tại). Các công ty sẽ cần bổ sung hàng trăm ngàn, thậm chí lên đến hàng triệu nhân sự trong lĩnh vực kỹ thuật số để có thể tồn tại trong kỷ nguyên kỹ thuật số này. Không có gì lạ khi Harvard Business Review gọi là Data Science là công việc quyến rũ nhất trong thế kỷ 21.
Một báo cáo của Viện McKinsey Global cảnh báo về sự thiếu hụt tài năng lớn về data và analyst. Vào năm 2018, riêng Mỹ có thể phải đối mặt với sự thiếu hụt 140.000 đến 190.000 người có kỹ năng deep analytical cũng như 1,5 triệu managers và analysts có khả năng phân tích bigdata để đưa ra quyết định hiệu quả.
Bởi vì cuộc cách mạng kỹ thuật số đã chạm đến mọi khía cạnh của cuộc sống, cơ hội được hưởng lợi từ việc hiểu về các hành vi của con người là rất lớn. Với một bộ dữ liệu phù hợp, các nhà bán lẻ có thể nhìn vào thói quen mua hàng của người dùngđể đưa ra những quyết định giúp tăng lợi nhuận. Tuy nhiên, họ chỉ có thể làm vậy nếu họ có các Data Scientist làm việc cho họ. Chính vì vậy, nó giống như một cuộc chạy đua vũ trang để tìm kiếm các Data Scientist.
Với sự thiếu hụt Data Scientist, các nhà tuyển dụng sẵn sàng trả tiền rất nhiều tiền cho những tài năng trong lĩnh vực này.
- Michael Chui, một hiệu trưởng tại McKinsey, đã chia sẻ trong một cuộc phỏng vấn: "Khoa học dữ liệu đã trở nên liên quan và cần thiết với mọi công ty ... có một cuộc cạnh tranh về tuyển dụng các tài năng ở vị trí này".
- Một ví dụ khác, ông Paul Minton từ một nhân viên phục vụ nhà hàng mới mức lương $20.000 1 năm. Ông học nhiều môn chuyên ngành liên quan đến toán ở trường đại học, tham gia một khóa học kéo dài ba tháng về Data Science và đã thay đổi mọi thứ. Ông đã kiếm được hơn $100.000 1 năm với vai trò Data Scientist công ty khởi nghiệp ở San Francisco.
II. Định nghĩa
Mặc dù Data Science và Big Data được sử dụng khá phổ biến, tuy nhiên mọi người thường không hiểu rõ, hiểu mơ hồ, hoặc hiểu nhưng không thể diễn đạt. Một câu hỏi tưởng chừng đơn giản như Data Science là gì?, Data Scientist là gì?,... có thể dẫn đến nhiều câu trả lời. Trong bài viết này, mình sẽ cố gắng giải thích và định nghĩa những khai niệm này theo góc nhìn của tác giả trong quyển sách Getting Started with Data Science của IBM
1. Data Scientist là gì
Data Scientist là một người tìm ra giải pháp cho các vấn đề bằng cách phân tích dữ liệu bằng các công cụ phù hợp và sau đó nói với những câu chuyện để truyền đạt những phát hiện của mình (data storytelling) cho các bên có liên quan (stakeholder) – từ lãnh đạo cấp cao, quản lý đến khách hàng. Nói một cách dễ hiểu, Data Scientist là những người làm việc cũng dữ liệu và cho ra các insight và truyền đạt các insight này với các bên liên quan. Kích thước dữ liệu lớn hay nhỏ, sử dụng các công cụ phân tích nào (ví dụ như Machine Learning) sẽ không quan trọng, miễn là có một tâm trí tò mò, khả năng phân tích và truyền đạt những phát hiện, thì tôi coi họ là một Data Scientist.
2. Data Science là gì
Nếu bạn đã hiểu Data Scientist là gì thì thật dễ dàng để định nghĩa Data Science là gì . Data Science chính là những gì mà các Data Scientist làm. Data Science là một lĩnh vực liên quan đến xử lý dữ liệu, phân tích và trích xuất thông tin chi tiết từ dữ liệu bằng các phương pháp thống kê và thuật toán máy tính khác nhau. Đây là một lĩnh vực đa ngành kết hợp Toán học, Thống kê và Khoa học máy tính
3. Điều gì tạo nên một Data Scientist?
Điều quan trọng nhất cho một Data Scientist chính là tính tò mò. Một Data Scientist phải là một người có tính tò mò, sẵn sàng dành thời gian và công sức để khám phá những linh cảm của mình. Trong báo chí, các biên tập viên gọi nó là nose for news. Không phải tất cả các phóng viên biết tin tức nằm ở đâu. Chỉ những người có nose for news mới có thể cảm nhận được tin tức đến từ đâu. Tò mò cũng quan trọng không kém đối với các nhà khoa học dữ liệu như đối với các nhà báo.