Thế giới công nghệ dường như đã phát điên lên vì các nhà khoa học dữ liệu trong những năm gần đây: nhiều người muốn trở thành data scientist và nhu cầu tuyển dụng cũng ngày một tăng lên. Nhưng đây là một quá trình khó khăn và đau đớn cho cả hai bên. Cho dù bạn là một ứng viên đang cố gắng tìm kiếm một vai trò hoàn hảo hay một tổ chức đang tìm kiếm sự phù hợp – có rất nhiều cạm bẫy cần đề phòng.
Đối với những người nhập vai, sẽ có sự bối rối không biết bắt đầu từ đâu. Cố gắng trở thành Nhà khoa học dữ liệu có thể cảm thấy giống như một nhiệm vụ bất khả thi. Có quá nhiều thứ để học. Tệ hơn nữa, việc tìm kiếm các kỹ năng phù hợp cho vai trò mà bạn tham gia giống như chơi Tetris được đặt ở chế độ vô hình.
Đối với các doanh nghiệp cần tuyển dụng những người phù hợp, họ thật sự gặp nhiều khó khăn, đặc biệt là khi họ tuyển những nhà khoa học dữ liệu đầu tiên.
Mặc dù có vô số con đường dẫn đến thất bại trong bất kỳ quy trình tuyển dụng nào, nhưng bài viết này vạch ra một số sai lầm phổ biến nhất từ kinh nghiệm của chính tác giả, giải thích tại sao bạn có thể dễ dàng nhận thất bại trong phỏng vấn vị trí khoa học dữ liệu. Ngoài hiểu biết về máy học, thống kê, lập trình, v.v., bạn cần phải học một bộ kỹ năng chuyên môn trong suốt sự nghiệp của mình với tư cách là một data scientist.
Thị trường việc làm công nghệ đang cạnh tranh hơn bao giờ hết và không có gì ngạc nhiên đối với các nhà khoa học dữ liệu đầy tham vọng rằng ngay cả việc vượt qua rào cản đầu tiên cũng có thể khó khăn. Nó thậm chí có thể khó khăn hơn nếu bạn không thiết lập bản thân để thành công. Lời khuyên dưới đây sẽ giúp bạn tránh được những cạm bẫy thường gặp nếu bạn đang tìm kiếm một công việc hoàn toàn mới hoặc một cơ hội thăng tiến ở vị trí hiện tại của bạn.
Nếu là nhà tuyển dụng và đang muốn thuê các nhà khoa học dữ liệu, bạn có thể thấy một số điểm hữu ích dành cho mình.
Vậy, những con đường phổ biến nhất để thất bại trong cuộc phỏng vấn khoa học dữ liệu là gì?
1- Sử dụng những thuật ngữ thời thượng trong đơn xin việc
Thật khó mà tránh được việc chỉnh sửa sơ yếu lý lịch của bạn để trở nên nổi bật. Bạn đọc quảng cáo tuyển dụng và thấy một vài công nghệ mà bạn chỉ biết một cách hời hợt. Bạn nghĩ rằng không có hại gì, mình sẽ chuẩn bị trước cuộc phỏng vấn. Đây là một cách không thể hay hơn để vượt qua các bộ lọc tuyển dụng tự động được các nhà tuyển dụng sử dụng. Và bạn có thể nghĩ rằng đó là một bước đi tốt.
Tuy nhiên, bạn quên rằng nhiều nhà khoa học dữ liệu có kinh nghiệm sẽ biết những kỹ năng này mất bao lâu để học. Hơn nữa, họ sẽ muốn biết cụ thể và chi tiết. Có thể bạn đã biết về mô hình kỹ năng chữ T (T-shaped Skills), có kiến thức rộng về nhiều công cụ và công nghệ nhưng hãy chọn một chủ đề và đi thật sâu. Điều này giúp bạn có cơ hội hướng cuộc phỏng vấn theo đúng sức mạnh của mình.
Nó có thể trở nên rõ ràng rất nhanh nếu bạn không thực sự hiểu rõ nội dung của mình. Và như vậy bạn đã lãng phí thời gian quý báu mà lẽ ra bạn có thể dùng để thể hiện điểm mạnh của mình và qua việc này bạn đã chứng minh rằng bạn không thể được tin tưởng.
2- Không tìm hiểu sâu
Tôi đã thấy điều này rất nhiều lần – một ứng viên sáng giá, tài năng bắt đầu nói về tất cả kinh nghiệm của họ, và điều này thoạt đầu có vẻ tốt, nhưng khi chúng tôi bắt đầu tìm hiểu sâu hơn một chút, câu trả lời cho những câu hỏi đơn giản như:
- Sự khác biệt giữa thuật toán XGBoost (Extreme Gradient Boosting) và Random Forest (rừng ngẫu nhiên) là gì?
- Bạn có thể giải thích các bước trong việc xây dựng cây quyết định(decision tree)?
- Làm cách nào để bạn chọn số lượng clusters khi sử dụng K-Means Clustering?
dường như không đến dễ dàng. Đặt những câu hỏi sâu hơn về lý do tại sao sử dụng công cụ này hơn công cụ khác thậm chí có thể không được trả lời.
Vấn đề là, thật dễ dàng chỉ cần tải thư viện lên hoặc sao chép các notebook từ Kaggle là có thể bắt đầu, đến mức nhà khoa học dữ liệu có thể thấy một số kết quả mà không cần phải hiểu đúng về những gì đang xảy ra. Giờ đây, bạn không cần phải suy ra các phương trình từ đầu cho mọi mô hình bạn sử dụng.
Một cách hiệu quả, hãy vẽ sơ đồ các quy trình cơ bản cho các công cụ bạn sử dụng và tự tin nói về chúng khi được hỏi. Hiểu được cách hoạt động của các mô hình này sẽ cho phép bạn xác định rõ hơn khi nào chúng phù hợp và khi nào chúng không phù hợp.
3- Tập trung quá nhiều vào một thứ
Học máy là một chủ đề lớn nên có vẻ khôn ngoan nếu bạn dành nhiều thời gian và tập trung vào đó. Tuy nhiên, đối với nhiều tổ chức, điều này có thể khiến bạn không có các kỹ năng cần thiết rộng hơn để thực sự tạo ra ấn tượng.
Phần lớn thời gian trong các dự án khoa học dữ liệu được dành cho các nhiệm vụ khác ngoài học máy. Bạn cần dành thời gian xây dựng các kỹ năng kỹ thuật khác, chẳng hạn như xử lý dữ liệu, điện toán đám mây, thống kê và phân tích.
Thiết kế các thử nghiệm phù hợp và biết cách kiểm tra giả thuyết quan trọng hơn việc biết công cụ nào sẽ mang lại cho bạn độ chính xác cao nhất. Ngoài ra, thật đáng để bạn dành thời gian tìm hiểu về các kiến thức khác thay vì chỉ tập trung vào học máy.
4- Không có khả năng liên kết các kỹ năng kỹ thuật với các vấn đề kinh doanh
Đây thường là trải nghiệm khó chịu nhất khi tuyển dụng. Một cá nhân có năng lực và tài năng rõ ràng, biết rõ về các kỹ năng kỹ thuật chuyên sâu sẽ bị bối rối khi nói về khía cạnh thương mại của vai trò này.
Dù muốn hay không, bạn vẫn ở đó để gia tăng giá trị cho doanh nghiệp. Đơn giản là giải quyết các vấn đề kỹ thuật thường là bước đầu tiên. Trong một nhóm lớn hơn, điều này có thể được đền bù bởi các thành viên khác có sự nhạy bén về thương mại hơn – nhưng nó vẫn là một lá cờ đỏ trong nhiều trường hợp.
Nhiều công ty phải từ bỏ những nhà khoa học dữ liệu vĩ đại trên lý thuyết vì cái tôi của họ đã ngăn họ tham gia vào công việc kinh doanh và trở nên lạc lõng giữa đám mây kỹ thuật. Có một sự hợm hĩnh về trí tuệ nhất định mà bạn thấy ở nhiều nhà khoa học dữ liệu thuở mới vào nghề luôn có hại nhiều hơn lợi.
Hãy dành thời gian để thực sự hiểu những công cụ và ý tưởng này có thể chuyển thành giá trị thực như thế nào.
Cố gắng truyền đạt mọi thứ quan trọng đối với doanh nghiệp của bạn – tiết kiệm chi phí và lợi nhuận thay vì chỉ chính xác và chính xác.
5- Thiếu kiến thức cụ thể về doanh nghiệp
Điều này thường xuyên xảy ra cho dù nó quá dễ dàng để vượt qua. Bạn vượt qua giai đoạn đầu của cuộc phỏng vấn khoa học dữ liệu, mọi việc diễn ra tốt đẹp, nhưng khi được hỏi về những gì ứng viên biết, họ chỉ đơn giản nói ra những gì họ đã đọc lướt qua trang web công ty, và thế là xong.
Nhiều người trong lĩnh vực công nghệ (đặc biệt là dữ liệu) thích nói về những gì họ đã làm. Nếu bạn sắp tham gia một cuộc phỏng vấn khoa học dữ liệu, hãy cố gắng tìm kiếm bất kỳ và tất cả thông tin bạn có thể về các dự án cụ thể mà họ đã thực hiện. Điều này sẽ cung cấp cho bạn cái nhìn sâu sắc về các kỹ năng và lĩnh vực quan trọng đối với họ.
Đọc qua tài liệu tiếp thị gần đây. Tìm kiếm các bài đăng trên blog trên trang web của công ty. Cố gắng kết nối với những người sẽ phỏng vấn bạn.
Bạn nên cố gắng tìm các cá nhân trên LinkedIn – xem họ có blog cá nhân hay gần đây đã thực hiện các cuộc nói chuyện về ngành hay không. Điều này sẽ làm cho bạn nổi bật là đã thực sự chuẩn bị tìm hiểu về công ty mình ứng tuyển. Những trang web đánh giá công ty cũng cũng có thể giúp bạn có thêm thông tin.
Kết luận
Mặc dù danh sách này không đầy đủ, nhưng đây là những vấn đề phổ biến có thể làm bạn thất bại trong cuộc phỏng vấn về khoa học dữ liệu. Hãy ghi nhớ và tránh những sai lầm không đáng có
Bài của tác giả Adam Sroka: https://betterprogramming.pub/5-ways-to-fail-a-data-science-interview-and-how-to-avoid-them-2472085ad45
Cover photo: by Estée Janssens on Unsplash
Bạn có biết?
tham gia cộng đồng ITguru trên Linkedin, Facebook và các kênh mạng xã hội khác có thể giúp bạn nhanh chóng tìm được những chủ đề phát triển nghề nghiệp và cập nhật thông tin về việc làm IT mới nhất
Linkedin Page:
Facebook Group:
cơ hội việc làm IT : ITguru.vn