Chuyên viên phân tích dữ liệu với kỹ năng SQL và Python | Nam Thủ Đức – Hồ Chí Minh

Giới thiệu về ứng viên

Data Analyst, SQL, Python, Machine Learning, Data Visualization, Excel …

● MỤC TIÊU NGHỀ NGHIỆP

○ Ứng dụng những kĩ năng của mình vào việc phân tích dữ liệu giúp cho hệ thống vận hành một cách tối ưu nhất. Ngoài ra cũng muốn dựa vào những kiến thức mình đã biết về Machine Learning, từ đó áp dụng vào việc dự đoán giúp hệ thống giảm thiểu rủi ro có thể gặp phải. Mục tiêu gần nhất trở thành Data Scientist trong lĩnh vực mình đang làm một cách nhanh chóng.

● KINH NGHIỆM LÀM VIỆC

○ VPBank 03/2023 – 07/2023

• Intern Data Analyst
• Phân loại dữ liệu điều tra theo tiêu chí Bigcase: Tham gia rà soát dữ liệu điều tra trong quá khứ, phân loại và chọn lọc các vụ việc bigcase nhằm xây dựng bộ tiêu chí chung xác định bigcase gian lận để tập trung nguồn lực.
• Hỗ trợ cải thiện câu truy vấn SQL trong task Indicator: Hỗ trợ các anh chị trong team review và tối ưu hóa bộ code indicator trên SQL Server nhằm tăng hiệu suất và chất lượng dữ liệu đầu ra.
• Phân tích dữ liệu Sale Scoring: Nghiên cứu dữ liệu liên quan, thử nghiệm ứng dụng các mô hình truyền thống/mô hình học máy vào việc chấm điểm gian lận cho CBBH thuộc phân khúc KHCN. Đánh giá tính hiệu quả và đóng góp ý tưởng cho việc xây dựng các mô hình liên quan.
• Tham gia đánh giá UAT nghiệm thu kết quả phát triển BRD tự động đồng bộ Danh sách Cảnh báo trên hệ thống JIRA – RRT: Phối hợp đầu mối quản lý DSCB để lên kịch bản kiểm thử, thực hiện kiểm thử theo kịch bản đã xây dựng, đảm bảo kết quả đầu ra.
• Tìm kiếm danh sách và thông tin chi tiết các bài viết, group có biểu hiện nghi vấn gian lận trên nền tảng mạng xã hội. Chọn lọc các trường hợp cần thiết đưa vào danh sách phân tích phát hiện sớm gian lận liên quan đến VPBank.

● KỸ NĂNG

○ SQL – Intermediate: Thành thạo sử dụng SQL, thiết kế và quản trị Database ở một số project: Quản lý quán Cafe, hệ thống quản lý nhân sự.

○ Python – Intermediate: Sử dụng Python để phân tích dữ liệu TMĐT, phân tích dữ liệu kinh doanh. Sử dụng Numpy, Pandas để làm sạch và chuẩn hóa. Sử dụng SeaBorn, Matplotlib để trực quan hóa.

○ Excel – Intermediate: Trực quan hóa dữ liệu và phân tích dữ liệu trong dự án phân tích dữ liệu Sale Scoring.

● HỌC VẤN

○ Đại học Giao thông Vận tải 2019 – 2023

• Tốt nghiệp: Khá

● CHỨNG CHỈ

○ 2023 – 2025 TOEIC 480

○ 2023 – 2025 SQL (Advanced) HackerRank

● PROJECT CÁ NHÂN

○ Báo cáo và Phân tích dữ liệu kinh doanh: Trong đó, áp dụng các kĩ thuật chuẩn hóa dữ liệu và thực hiện các thuật toán KNN classic, Kmeans và Linear Regression cho việc dự đoán.

• Nguồn data: https://github.com/boringPpl/Sales-Reporting/tree/main/data
• Project sử dụng ngôn ngữ Python với các thư viện: Pandas, NumPy, Matplotlib để phân tích dữ liệu. Source code: https://bom.so/JLoepg

○ PowerBI – Intermediate: Trực quan hóa dữ liệu với dữ liệu mô phỏng của Shoppee và Netfix. Trong các dự án có tạo các Measure để phục vụ cho việc trực quan hóa.