Năm 2012, tạp chí Harvard Business Review (HBR) đã đưa ra một dự đoán rằng Khoa học dữ liệu (Data Science) sẽ là công việc hot nhất của Thế kỷ 21. Kể từ đó, sự quan tâm và việc ứng dụng Khoa học dữ liệu càng ngày càng gia tăng. Các báo cáo gần đây đã chỉ ra một thực tế rằng, nhu cầu tuyển dụng các nhà khoa học dữ liệu vượt xa nguồn cung.

Tuy nhiên, cũng có sự cạnh tranh rất lớn trong lĩnh vực này. Các nhà khoa học dữ liệu có thể đến từ tất cả các lĩnh vực, từ Vật lý, Toán học, nền tảng thống kê cho đến Khoa học máy tính… Vậy nếu bạn chuẩn bị cho một cuộc phỏng vấn vị trí liên quan đến khoa học dữ liệu thì bạn cần chuẩn bị thế nào cho tốt? Các bước chuẩn bị sau có thể giúp ích cho bạn.

Tìm hiểu kĩ về vị trí công việc mà bạn đã ứng tuyển

Bạn nên xem qua mô tả công việc và cố gắng tìm hiểu về công việc bạn sẽ làm. Với từng vị trí công việc khác nhau, bạn sẽ nhận được các câu hỏi tương ứng:

  • Nếu công việc là thực hiện và giải thích các thí nghiệm để kiểm tra các biến số của sản phẩm

Bạn cần chú ý đến những câu hỏi liên quan đến quy trình A/B testing, liên quan đến những số liệu nào là tốt nhất trong việc tối ưu hóa và câu hỏi về cách đánh giá tốt nhất kết quả thử nghiệm của bạn.

  • Công việc: Tìm hiểu chuyên sâu về cách thức mà người dùng sử dụng sản phẩm

Chú ý những câu hỏi kiểm tra khả năng thực hiện một dự án về dữ liệu từ đầu đến cuối, và cách mà bạn truyền đạt các phát hiện của bạn một cách hiệu quả và trung thực. Nhà tuyển dụng có thể thảo luận với bạn về kinh nghiệm các dự án từ có được trước đây. Hoặc họ cũng muốn biết thêm về sự học hỏi của bạn và khả năng truyền đạt những gì bạn tìm thấy và những điều đã làm.

  • Công việc: Thực hiện nghiên cứu ứng dụng về các vấn đề suy luận, dự đoán hoặc tối ưu hóa

 Những vị trí này yêu cầu nhiều hơn và có thể bạn phải có bằng tiến sĩ. Bạn nên đọc qua bản mô tả công việc để xem những gì họ đang tìm kiếm và nghiên cứu về các kỹ thuật học thuật để giải quyết một số vấn đề mà team bạn đang phỏng vấn có thể gặp phải.

  • Công việc:  Phát triển thuật toán cho sản phẩm dữ liệu (data product)

Lấy ví dụ: tính năng Surge Pricing của Uber hoặc tính năng People You May Know của LinkedIn. Tùy thuộc vào vai trò cụ thể của bạn, bạn có thể nhận được một cuộc phỏng vấn kỹ thuật phần mềm truyền thống, tập trung vào xử lý lượng dữ liệu lớn hoặc được hỏi về kinh nghiệm trước đây của bản thân trong việc giải quyết các vấn đề dữ liệu có quy mô lớn, khó khăn và tùy biến cao.

Tất nhiên, có rất nhiều vị trí công việc dành cho một nhà khoa học dữ liệu – vì vậy hãy nghiên cứu về cả sản phẩm và công việc trước khi bạn đi phỏng vấn.

Cuối cùng, câu hỏi quan trọng mà bạn nên tự hỏi mình – vai trò của tôi tại công ty, cách tốt nhất để hiểu rõ nhất và cải thiện sản phẩm và doanh nghiệp sử dụng dữ liệu là gì?

Tìm hiểu về sản phẩm

Nếu bạn có thể sử dụng sản phẩm, hãy sử dụng nó càng nhiều càng tốt trước khi đi phỏng vấn. Nhà khoa học dữ liệu tham gia rất nhiều vào quá trình đưa ra quyết định để giúp cải thiện sản phẩm và các tính năng – và để hiểu rõ sản phẩm theo định lượng càng nhiều càng tốt.

Hãy cứ tò mò, và hãy tìm câu trả lời cho những câu hỏi đại loại như:

  • Sản phẩm này có thể được cải thiện như thế nào?
  • Loại số liệu nào cần được định để đo lường sự thành công của sản phẩm?
  • Làm thế nào để thương mại hóa sản phẩm?
  • Làm thế nào để thương mại hóa sản phẩm hiệu quả hơn?
  • Mối quan hệ của sản phẩm này được xác định ra sao?
  • Đâu là nguyên nhân khiến sản phẩm chậm tiêu thụ?
  • Bạn mong muốn người dùng của bạn sử dụng các kênh hoặc hành động chính nào?

Hãy cho mọi người nhận thấy rằng, bạn hiểu biết về cách mà một nhà khoa học dữ liệu sẽ làm để cải thiện hệ thống.

Tự làm quen với sản phẩm, bởi vì bạn rất dễ để lộ sự thiếu chuẩn bị nếu như không có kiến ​​thức cơ bản về sản phẩm bạn sẽ làm việc với nó. Ngoài ra, người phỏng vấn có thể sẽ hỏi bạn các câu hỏi liên quan đến dữ liệu về các dự án họ đang làm.

Hãy nghĩ cách thức cải thiện sản phẩm

 Sau khi tìm hiểu về sản phẩm nhiều nhất có thể – hãy tự hỏi chất vấn bản thân:

  • Các khía cạnh mà bạn thực sự thích về sản phẩm là gì? Các tính năng yêu thích của bạn? Tại sao bạn nghĩ rằng những tính năng đó tồn tại?
  • Các khía cạnh của sản phẩm mà bạn không thích? Lý do của điều này? Tại sao sản phẩm thậm chí có thể có một tính năng như vậy nếu như vẫn có những người không thích nó?
  • Nếu bạn có thể đề xuất một số tính năng mới cho sản phẩm, bạn sẽ đề xuất điều gì? Đây có phải là một cái gì đó nhằm mục đích tăng tăng trưởng, tăng sự thu hút, tăng doanh thu hoặc giá trị thương hiệu? Bạn có nghĩ rằng các tính năng được đề xuất của bạn sẽ có tỷ suất hoàn vốn (ROI) cao hay không?
  • Những cách thức mà công ty có thể sử dụng dữ liệu để giúp cải thiện sản phẩm là gì mà dường như chưa được thực hiện?

Những câu hỏi này sẽ giúp bạn suy nghĩ về sản phẩm và nhiều sự đánh đổi khác nhau được thực hiện trong việc đưa ra các quyết định về sản phẩm.

Điều này giúp bạn có suy nghĩ đúng đắn để trả lời một số câu hỏi về sản phẩm và những gì các nhà khoa học dữ liệu đang làm để giúp làm cho nó trở nên tốt nhất có thể.

Xác định KPI  (key performance indicators) cho sản phẩm

Sau khi tìm hiểu kỹ về sản phẩm, hãy nghĩ về điều này: một số số liệu chính mà sản phẩm có thể muốn tối ưu hóa là gì? Một phần vai trò của nhà khoa học dữ liệu trong một số công ty nhất định liên quan đến việc hợp tác chặt chẽ với các nhóm sản phẩm để giúp xác định, đo lường và báo cáo về các số liệu này. Đây là một việc bạn có thể tự mình thực hiện tại nhà và thực sự có thể giúp ích trong quá trình phỏng vấn.

Bạn có thể tham khảo thêm cách đo lường Hiệu ứng mạng (network Effect), là một hiện tượng theo đó số người hoặc người tham gia tăng lên sẽ cải thiện giá trị của hàng hóa hoặc dịch vụ. Có một tài liệu rất hay về 16 cách để đo lường hiệu ứng mạng (Network Effect)  nên đọc.

Xem lại số liệu thống kê và giải thích thử nghiệm của bạn

 Nếu bạn đang phỏng vấn với một công ty Consumer Internet (những công ty như Google, Uber, Amazon… đều thuộc dạng này), rất có thể họ sẽ thực hiện một số loại thử nghiệm A/B để quyết định ra mắt tính năng. Đây thường là một điều mà nhiều ứng viên không chuẩn bị khi họ bắt đầu tìm kiếm các vị trí công việc ngành khoa học dữ liệu, chủ yếu là vì nhiều trường đại học không có  nhiều lớp về thống kê để họ có thể học hỏi. Hiểu giải thích thử nghiệm, quy trình A/B testing là gì và cách giải thích kết quả theo thống kê là vô cùng quan trọng nếu bạn đang phỏng vấn với một công ty thực hiện quy trình A/B testing.

Bạn có thể tham khảo thêm những câu trả lời hữu ích về quy trình A/B testing từ Ronny Kohavi (Trưởng Bộ phận thử nghiệm tại Microsoft) 

Xem lại coding và SQL

 Các vị trí ngành khoa học dữ liệu bao gồm một số kỹ thuật phần mềm cơ bản trong vai trò sẽ có phiên bản thu nhỏ của một cuộc phỏng vấn kỹ thuật phần mềm thông thường. Chuẩn bị thông thường cho các cuộc phỏng vấn kỹ thuật phần mềm sẽ giúp ích, vì thường thì bạn sẽ được yêu cầu triển khai code nhằm hoàn thành một nhiệm vụ nhất định.

Các vị trí ngành khoa học dữ liệu có thành phần phân tích nặng trên vai trò có thể đánh giá bạn dựa trên SQL. SQL là một trong những chủ đề đơn giản nhất để chuẩn bị, với phạm vi hạn chế hơn và tính sẵn có của các tài nguyên. Bạn có thể tham khảo các Câu trả lời của William Chen về cách tốt nhất để học SQL cho ngành khoa học dữ liệu là gì?

Hy vọng những thông tin trên sẽ giúp bạn chuẩn bị tốt cho cuộc phỏng vấn vào các vị trí liên quan đến khoa học dữ liệu. Nếu bạn có comment gì hãy để lại ô bên dưới nhé.

Theo towardsdatascience.com