Nếu bạn khao khát trở thành Data Scientist vào năm 2021, bạn đã đọc đúng bài viết rồi đấy. Trong bài viết này, chúng tôi sẽ hướng dẫn bạn con đường trở thành Data Scientist. Tất nhiên, cần có quyết tâm, động lực và rất nhiều kỷ luật. Nếu bạn nghĩ rằng bạn đã sẵn sàng cho thử thách, hãy cùng đọc tiếp.
#1 Bạn có nên trở thành Data Scientist?
Câu hỏi đầu tiên bạn nên hỏi, tại sao lại là Data Scientist?
Những “lời đồn” xung quanh chủ đề data science rất thực tế nhưng đó không phải là lý do duy nhất khiến bạn dấn thân vào lĩnh vực này. Thực tế, trở thành Data Scientist không phải là điều dễ dàng. Một Data Scientist đòi hỏi phải có sở trường nhất định trong việc xem xét dữ liệu và liên quan đến rất nhiều thử nghiệm, nghiên cứu, tư duy phản biện và phân tích. Các phương tiện truyền thông thường miêu tả data science như “những đứa trẻ chơi đùa bên cửa sổ”, làm việc dựa trên công nghệ tuyệt vời như AI nhưng đằng sau mỗi lời đồn ấy là hàng giờ làm việc chăm chỉ và kiên trì.
Nếu bạn nghĩ rằng bạn đã thực hiện công việc nghiên cứu của mình và quyết định rằng Data Scientist phù hợp với bạn, thì đây là tin tốt.
Thời điểm tốt nhất để tham gia vào data science là NGAY BÂY GIỜ.
Một số thống kê:
- Báo cáo của Linkedin cho thấy Chuyên gia trí tuệ nhân tạo là công việc mới nổi số 1 vào năm 2020,
- World Economic Forum dự đoán rằng data science và các vị trí liên quan đã tạo ra mức tăng thực 58 triệu việc làm vào năm 2022, và
- Glassdoor tiết lộ rằng mức lương cơ bản trung bình của một Data Scientist là 107.801 đô la
Ngành khoa học dữ liệu cũng đã trưởng thành đáng kể trong những năm gần đây với tiềm năng và được hầu hết các ngành công nhận. Các lĩnh vực như chăm sóc sức khỏe, tài chính, nông nghiệp, bán lẻ, quốc phòng đã chứng kiến hoạt động của họ bị ảnh hưởng bởi AI và nhiều hơn thế nữa. Điều này có nghĩa là việc trang bị cho mình các kỹ năng về data science có giá trị đối với nhà tuyển dụng của bạn, bất kể ngành nghề nào.
Hơn nữa, học data science chưa bao giờ dễ dàng hơn thế! Mối quan tâm to lớn đến data science đã dẫn đến sự bùng nổ về số lượng tài nguyên data science, mang lại lợi ích cho cả người mới bắt đầu và những người thực hành trong lĩnh vực này. Các bài giảng video, các bài báo trên blog và sách điện tử, nhiều loại tài liệu giảng dạy khác nhau được công bố rộng rãi cho người học.
#2 Những vị trí trong Data Science
Có nhiều vị trí khác nhau trong lĩnh vực data science:
- Data Analyst
- Data Scientist
- Machine Learning Specialist
- Data Engineer
- Business Analyst
- AI Research Scientist
Tại sao lại quan trọng? Vị trí làm việc bạn chọn quyết định các kỹ năng cần trau dồi. Business Analyst quan tâm đến chi tiết sản phẩm và kiến thức kinh doanh trong khi Machine Learning Specialist tập trung vào việc xây dựng mô hình. Một lời khuyên là hãy tận dụng bất kỳ kinh nghiệm nào bạn có thể có trước đó. Bằng cách này, bạn có thể khiến mình ghi điểm với các nhà tuyển dụng khi bạn sở hữu những kỹ năng phân tích dữ liệu theo lĩnh vực cụ thể.
Hãy tìm kiếm giá trị thực của bạn trong giai đoạn này và tìm ra vị trí làm việc mà bạn thực sự muốn.
#3 Kiểm tra trình độ
Kiểm tra những gì bây giờ?
Đây là lúc để đánh giá trình độ trong quá khứ của bạn và xem bạn nên bắt đầu hành trình học tập về data science từ đâu. Không quan trọng nếu đó là một khởi đầu mới, nhưng điều quan trọng là phải biết bắt đầu từ đâu.
Về cơ bản, bạn nên cố gắng kiểm tra những kỹ năng cơ bản cần thiết này để trở thành data scientist;
- Xác suất & Thống kê
- Giải tích & Đại số tuyến tính
- Lập trình
- Data Visualisation
- Machine Learning
Nhiều người trong số các bạn sẽ nghi ngờ bản thân ở giai đoạn này và đặt câu hỏi liệu bằng cấp của bạn có thể xây dựng sự nghiệp trong ngành data science hay không. Ngoài những công việc mang tính học thuật cao hơn như AI Research ScientistI, bạn chắc chắn không cần bằng Tiến sĩ. hoặc thậm chí là bằng cấp cao hơn để vượt trội trong data science
#4 Nâng cao kỹ năng Data Science của bạn
Có 3 cách để học Data Science.
- Bootcamps
- Bằng sau đại học (Thạc sĩ hoặc Tiến sĩ)
- Các khóa học trực tuyến mở rộng (MOOC)
Bootcamps
Bootcamps về cơ bản là khóa đào tạo chuyên sâu kéo dài từ vài tuần đến vài tháng. Nhằm mục đích bao gồm nhiều nội dung nhất có thể trong thời gian ngắn. Thời gian cũng là một yếu tố vì chúng thường đòi hỏi cam kết thời gian lớn trong suốt khóa học. Do đó, tùy chọn này chỉ được khuyến nghị cho những người học toàn thời gian có thể cam kết với lịch trình.
Ngoài ra, đây cũng là tùy chọn ít được cá nhân hóa nhất trong danh sách này. Chủ yếu là vì hầu hết các khóa đào tạo đều cho rằng không có kiến thức và cố gắng dạy mọi thứ từ đầu, vì vậy không cần phải tùy chỉnh theo trải nghiệm cá nhân vì mọi người đều giống nhau.
Điểm thưởng của chương trình đào tạo là cơ hội kết nối với những cá nhân có cùng chí hướng. Những người cùng học với bạn cũng sẽ có động lực như bạn và mọi người đều có mục tiêu chung. Hãy dành thời gian này để kết nối với những người khác và xây dựng vòng kết nối về data science.
Bằng tốt nghiệp
Bằng Cao học thường kéo dài từ 1–2 năm đối với bằng Thạc sĩ và từ 3–4 năm đối với Tiến sĩ. Đây là các chương trình sau đại học chuyên biệt với chương trình giảng dạy đã được xác thực cho chuyên ngành đã chọn. Một số ví dụ là Thạc sĩ Business Analytics của MIT và Thạc sĩ Khoa học về Data Science của Đại học Columbia. Hơn nữa, các chương trình này cung cấp một số mức độ cá nhân hóa, có thể chọn khóa học theo mong muốn. Tuy nhiên, đây cũng là lựa chọn đắt nhất trong danh sách này và nên cân nhắc điều đó.
Ghi danh vào một chương trình cấp bằng sau đại học thường là một cam kết rất lớn, vì vậy hãy đảm bảo rằng bạn đã thực hiện nghiên cứu của mình.
Các khóa học trực tuyến mở rộng (MOOC)
MOOCs đã đi một chặng đường dài kể từ khi nó lần đầu tiên bắt đầu. Các trường đại học được công nhận đang phát hành một số modules dưới dạng MOOC và ngay cả các công ty công nghệ lớn như Google cũng đã đưa ra các khóa học trực tuyến. Đã qua rồi cái thời mà MOOCs bị phản đối và các công ty đang trở nên dễ tiếp thu hơn với những người tự học. Sử dụng đúng tài nguyên và lộ trình học tập phù hợp, bất kỳ ai cũng có thể xây dựng kho kỹ năng data science của mình bằng các khóa học trực tuyến.
Ngoài ra, đã có sự chuyển đổi từ hình thức giảng dạy tại trường sang hình thức trực tuyến. Đối với những người muốn sự linh hoạt của các khóa học trực tuyến nhưng uy tín của một trường đại học, edX hoặc Coursera đã hợp tác với các trường Đại học lớn để cung cấp các chương trình Thạc sĩ trên nền tảng của họ. Điều này đã đưa MOOC lên một tầm cao mới.
Bất kể bạn chọn con đường nào, nâng cao kỹ năng data science là bước đầu tiên để trở thành Data Scientist.
#5 Làm việc trên các dự án
Kaggle
Kaggle, nền tảng data science tốt nhất. Mặc dù Kaggle được biết đến là những cuộc thi, nhưng bản thân việc làm việc trên Kaggle có thể là một dự án. Bộ dữ liệu Competition thường là dữ liệu thực do các công ty cung cấp với mục đích khai thác sức mạnh của cộng đồng để giải quyết vấn đề kinh doanh của họ. Trong cuộc thi, bạn sẽ trải qua toàn bộ quá trình thu thập dữ liệu -> xử lý dữ liệu -> mô hình hóa -> đánh giá -> và tối ưu hóa, tương tự như bất kỳ dự án data science ngoài đời thực nào.
Đối với người mới bắt đầu, có sân chơi hoặc cuộc thi kiến thức để kiểm tra các nguyên tắc cơ bản của bạn trong khi các cuộc thi nổi bật dành cho các Data Scientist và giành giải thưởng. Nếu có thể, hãy tham gia các cuộc thi nổi bật đang hoạt động vì xếp hạng bản thân so với bảng xếp hạng là một trải nghiệm tốt và là một bổ sung tuyệt vời cho sơ yếu lý lịch của bạn.
Tuy nhiên, nhược điểm lớn là các tập dữ liệu từ Kaggle đã được làm sạch trước. Việc xử lý trước cơ bản dữ liệu đã được các công ty đệ trình thực hiện trước khi tổ chức các cuộc thi ở Kaggle, giúp giảm bớt phần lớn khối lượng công việc của bạn. Nếu bạn chưa nghe, các Data Scientist thường dành tới 70% thời gian của họ để xử lý dữ liệu trong khi chỉ còn lại 30% cho việc lập mô hình.
Tự làm dự án của riêng mình
Bạn nên ra ngoài và làm việc với một số dự án tự khởi xướng. Không nhất thiết bạn phải thay đổi trò chơi hoặc sống tiết kiệm hơn. Chỉ cần mới lạ và sáng tạo sẽ làm nên thủ thuật. Nếu bạn biết ngành bạn muốn làm việc, làm việc trong các dự án liên quan đến ngành có thể là một khởi đầu rất tốt. Tìm các bộ dữ liệu có sẵn miễn phí hoặc tìm kiếm một trang web, trải qua quá trình thử nghiệm và trải nghiệm cảm giác trở thành Data Scientist. Không có lời khuyên nào tốt hơn là có những dự án của riêng bạn mà bạn có thể tự hào giới thiệu với nhà tuyển dụng.
#6 Xây dựng Profiles cá nhân Online
Sự hiện diện trực tuyến ngày càng trở nên quan trọng trong thế giới công nghệ bao gồm cả data science. Đối với những lập trình viên tự học, sự hiện diện trực tuyến giúp xác nhận công việc và trình độ trong data science. Xác nhận này xuất hiện dưới dạng những người theo dõi, nhận xét và đánh giá ngang hàng mà bạn có trong thế giới online. Tuy nhiên, đây không phải là bất kỳ người theo dõi hoặc tương tác trên mạng xã hội nào, tôi đề cập đến những người đọc và thấy bài viết của bạn thú vị, những người có cùng suy nghĩ hoặc vấn đề với bạn trong lĩnh vực này, hoặc thậm chí những người được truyền cảm hứng từ ý tưởng của bạn và sử dụng các dự án.
Vâng, cách dễ nhất để xây dựng sự hiện diện trực tuyến của bạn là viết ra suy nghĩ và chia sẻ công việc của bạn.
Medium
Hình ảnh từ https://medium.com/
Medium là một nền tảng viết bài trực tuyến, nơi người viết có thể viết và chia sẻ bài viết của họ mà không mất phí. Bạn không cần tên miền hoặc máy chủ lưu trữ để đăng nội dung của mình trực tuyến. Chỉ cần đăng ký một tài khoản, xây dựng hồ sơ cá nhân và viết. Medium cũng đã trở thành nền tảng ưa thích để xuất bản các bài báo data science, khiến nó trở thành lựa chọn tốt nhất để bạn bắt đầu.
Vậy viết gì? Nó có thể là bất cứ thứ gì hoặc mọi thứ. Mục tiêu chính là ghi lại những suy nghĩ, hành trình của bạn và thu hút những người như bạn.
Một số ý tưởng blog;
- Chia sẻ chương trình giảng dạy data science với những người khác
- Đánh giá các khóa học đã tham gia
- Viết ngắn gọn các dự án / cuộc thi data science .
- Suy nghĩ về vấn đề liên quan đến data science
GitHub
Hình ảnh từ https://github.com/
Bạn không thực sự thuộc lĩnh vực công nghệ nếu bạn không biết GitHub. GitHub là một nền tảng phát triển nơi người dùng tải lên các code nguồn mở của họ dưới dạng một kho lưu trữ (repo) để quản lý hoặc chia sẻ các dự án. Hơn nữa, còn có chức năng kiểm soát phiên bản tích hợp tuyệt vời mang lại lợi ích cho cả kỹ sư phần mềm và Data Scientist và cho phép cộng tác giữa các chuyên gia. Do đó, việc bắt đầu một tài khoản GitHub là một chặng đường dài để được chú ý trong không gian công nghệ. Một số nhà tuyển dụng tiềm năng thậm chí có thể yêu cầu GitHub để đánh giá các dự án, code và năng lực kỹ thuật của bạn!
Vậy bạn có thể làm gì với GitHub?
- Upload projects
- Fork interesting repos
- Commit to other repos
#7 LinkedIn và Networking
Đây là nơi LinkedIn vượt trội như một nền tảng xã hội. LinkedIn cho phép người dùng xây dựng hồ sơ chuyên nghiệp của họ và kết nối những người có cùng vị trí công việc. Bạn có thể tìm thấy những người trong không gian tương tự, gửi cho họ một thông điệp được cá nhân hóa và xây dựng các kết nối có ý nghĩa, tất cả trong một nền tảng duy nhất.
Dưới đây là 4 mẹo giúp bạn tối ưu hóa hồ sơ LinkedIn của mình.
1) Thêm ảnh Profile chuyên nghiệp
Đầu tiên, khi đăng nhập vào LinkedIn, hãy nhấp vào ‘xem hồ sơ‘ để chỉnh sửa hồ sơ của bạn.
Ảnh hồ sơ và ảnh bìa được sử dụng để đại diện cho chính bạn trên LinkedIn. Đây là điều đầu tiên mọi người nhìn thấy trước khi đọc hồ sơ của bạn và tạo ấn tượng đầu tiên.
Hình ảnh từ https://www.linkedin.com/
2) Điền vào các phần profile
Profile được tách biệt thành các phần. Các phần quan trọng nhất là kinh nghiệm, học vấn, chứng chỉ và dự án. Để bắt đầu, hãy nhấp vào ‘Thêm phần tiểu sử’ và thêm từng phần này vào tiểu sử .
Bạn có thể tìm thấy ‘Kinh nghiệm‘, ‘Học vấn‘ và Chứng chỉ trong khi ‘Dự án‘ có trong Thành tích. Mô tả thành tích của bạn, đây là hồ sơ của bạn và bạn nên tự hào về những gì bạn đã đạt được. Tuy nhiên cần thực tế và trung thực.
3) Cá nhân hóa phần giới thiệu
Tiếp theo, cá nhân hóa phần giới thiệu bằng cách nhấn vào biểu tượng bút chì dưới ảnh bìa. Thay đổi dòng tiêu đề để phản ánh tình trạng hiện tại của bạn. Đó có thể là vai trò hiện tại của bạn trong công ty, trình độ học vấn hiện tại, hoặc thậm chí là tuyên bố chung về bản thân.
Ví dụ,
- Chuyên viên phân tích dữ liệu trong công ty XYZ
- Chuyên ngành Khoa học Máy tính tại Đại học Stanford
- Người đam mê data science kết nối với những người có cùng chí hướng
Bất cứ điều gì mô tả bạn thực sự. Dòng tiêu đề sẽ xuất hiện cùng với ảnh hồ sơ nên đây cũng là nơi tạo ấn tượng đầu tiên.
4) Để nhà tuyển dụng tìm thấy bạn
Sau khi hoàn thành hồ sơ của bạn, bước cuối cùng là cho nhà tuyển dụng biết rằng bạn đang muốn tìm kiếm công việc. Quay lại trang hồ sơ, nhấp vào ‘Thêm phần hồ sơ‘ và tìm ‘Tìm kiếm cơ hội việc làm‘ trong Phần giới thiệu.
Hình ảnh của tác giả
Sau khi thiết lập, sẽ xuất hiện trên hồ sơ nhưng chỉ hiển thị cho nhà tuyển dụng.
Bây giờ bạn đã hoàn tất, hãy kéo danh bạ của bạn ra hoặc truy cập các network được đề xuất và bắt đầu kết nối.
Networking
LinkedIn hầu như không phải là cách duy nhất để kết nối. Trên thực tế, kết nối trực tiếp với những người khác để lại ấn tượng mạnh mẽ hơn và chắc chắn là những kết nối có ý nghĩa hơn. Tham gia cộng đồng data science hiện tại, tham dự các buổi gặp mặt hoặc tham dự một số hội nghị data science. Ngay cả khi bạn đang sử dụng LinkedIn, đừng bỏ lỡ những kênh kết nối này. Tất cả đều là những con đường tuyệt vời để gặp gỡ mọi người, thu thập ý tưởng và ai biết được, bạn có thể tìm thấy sếp tiếp theo của mình.
#8 Xây dựng Resume
Cuối cùng, bạn đã sẵn sàng để có được một công việc trong ngành data science. Chỉ còn một trở ngại cuối cùng – tạo Resume ấn tượng được nhà tuyển dụng chú ý. Các nhà tuyển dụng nhận được hàng trăm hồ sơ cho mỗi lần tuyển dụng, vì vậy, làm thế nào để bạn làm cho Resume của mình nổi bật hơn.
1) Profile
Ngoài tên của bạn, hãy đảm bảo thêm social và online profiles. Điều này cho phép các nhà tuyển dụng tìm thấy bạn dễ dàng nếu họ muốn.
2) Dự án
Nếu bạn chưa có bất kỳ kinh nghiệm nào liên quan đến data science, chúng tôi khuyên bạn nên ưu tiên các dự án data science của mình trước khi trải nghiệm. Liệt kê 3 dự án hàng đầu của bạn bắt đầu từ những dự án có ảnh hưởng nhất.
Đối với mỗi dự án;
- Đảm bảo tiêu đề dễ hiểu (Ví dụ: Sử dụng tâm lý tweet của Twitter để dự đoán giá của S&P 500)
- Mô tả dự án: Bắt đầu bằng động từ hành động mạnh -> Công cụ bạn đã sử dụng -> kết quả bạn đạt được
- Viết ngắn gọn, súc tích nhưng thể hiện năng lực của bạn một cách khách quan.
3) Kinh nghiệm
Phần Kinh nghiệm sẽ xuất hiện tiếp theo, liệt kê 2–3 kinh nghiệm làm việc gần đây và phù hợp nhất của bạn.
Đây là nơi mà kinh nghiệm viết blog của bạn có thể hữu ích nếu bạn không có bất kỳ kinh nghiệm công nghệ nào. Có vẻ không nhiều nhưng chắc chắn sẽ cho thấy sự nhiệt tình và động lực của bạn trong lĩnh vực data science.
Đối với những kinh nghiệm khác, hãy giữ chúng phù hợp với nhà tuyển dụng. Ngay cả khi kinh nghiệm của bạn không liên quan đến data science, hãy diễn đạt lại để các kỹ năng mềm của bạn như giao tiếp, lãnh đạo hoặc quản lý thời gian. Tất cả những điều đó cũng quan trọng như kỹ năng kỹ thuật của bạn đối với một Data Scientist.
4) Kỹ năng
Mặc dù bạn có thể viết bất cứ điều gì ở đây, nhưng hãy giữ nó ở một số ít quan trọng nhất, đặc biệt là trong phần ‘Chứng nhận & Khóa học‘. Trừ khi các chứng chỉ của bạn được công nhận rộng rãi, hầu hết các nhà tuyển dụng không quan tâm đến những gì bạn đã thi MOOC. Chỉ nêu những trường hợp phổ biến hoặc từ một trường đại học đáng tin cậy.
Đối với các kỹ năng kỹ thuật, không liệt kê tất cả các kỹ năng bạn nghĩ rằng bạn biết. Hãy có chiến lược. Sử dụng Mô tả công việc của công ty làm tài liệu tham khảo và viết những điều cần thiết cho vai trò bạn đang ứng tuyển.
Cố gắng giữ CV trong một trang, nhiều nhất là hai trang. Sự ngắn gọn là chìa khóa và cá nhân hóa từng CV phù hợp với vai trò đang ứng tuyển trước khi gửi.
#9 Được tuyển vào làm việc
Bây giờ bạn đã sẵn sàng với vị trí Data Scientist, hãy tiếp tục gửi resume của bạn và hy vọng điều tốt nhất. Là một Data Scientist tự học, lời khuyên là hãy kiên trì. data science không bao giờ là dễ dàng và việc được tuyển để trở thành một ngành data science cũng vậy. Đánh giá khả năng của bạn và đừng ngại bắt đầu từ vị trí thấp.
Đừng chờ đợi, hãy có động lực, hãy làm việc và cùng tôi tham gia vào sự nghiệp thú vị này của một Data Scientist.
Bài của Benjamin Lau đăn trên Towards Data Science
Bạn có biết?
tham gia cộng đồng ITguru trên Linkedin, Facebook và các kênh mạng xã hội khác có thể giúp bạn nhanh chóng tìm được những chủ đề phát triển nghề nghiệp và cập nhật thông tin về việc làm IT mới nhất
Linkedin Page:
Facebook Group:
cơ hội việc làm IT : ITguru.vn