Data analytics là gì? Các giai đoạn trong phân tích dữ liệu

Data analytics là gì? Trong cuộc sống, có vô số quyết định được thực hiện dựa trên dữ liệu thô (raw data) mà chúng ta thường không hay biết. Ví dụ, để quyết định hôm nay có nên đi cắm trại hay không; chúng ta thường dựa vào dự báo thời tiết – dựa trên các chỉ số dữ liệu từ phòng nghiên cứu khí tượng.

Data analytics là gì?

phân tích dữ liệu là gì

Phân tích dữ liệu là gì?

Phân tích dữ liệu trong tiếng Anh là Data Analytics.

Data analytics là môn khoa học phân tích dữ liệu thô để đưa ra được kết luận về thông tin đó. Nhiều kĩ thuật và qui trình phân tích dữ liệu đã được tự động hóa thành các qui trình cơ học và thuật toán để xử lí dữ liệu thô về hoạt động tiêu dùng của con người.

Data analytics có thể tìm ra các xu hướng và số liệu trong các khối thông tin mà có thể bị bỏ sót nếu không sử dụng kĩ thuật này. Thông tin thu được có thể được sử dụng để tối ưu hóa các qui trình làm tăng hiệu quả tổng thể của một doanh nghiệp hoặc một hệ thống.

Bất kì loại thông tin nào cũng có thể được áp dụng các kĩ thuật data analytics để rút ra những hiểu biết giúp cải thiện vấn đề. Ví dụ, các công ty sản xuất thường ghi lại thời gian chạy; thời gian chết và thời gian chờ đợi công việc của các máy để phân tích dữ liệu để lên kế hoạch tốt hơn cho khối lượng công việc để máy có thể hoạt động gần với công suất tối ưu.

Phân tích dữ liệu có nhiều tác dụng ngoài việc chỉ ra các nút thắt và vấn đề trong sản xuất. Ví dụ, các công ty game sử dụng phân tích dữ liệu để đặt lịch thưởng cho người chơi để giữ người chơi luôn gắn vào game.

Phân tích dữ liệu có bao nhiêu phần chính

Data analytics là gì trong Data warehouse, Business Reporting, KPI Metrics

Data Warehouse là một Kho dữ liệu có vai trò lưu trữ thông tin cần thiết hay toàn bộ dữ liệu thô sơ liên quan đến mục tiêu ban đầu được đề ra. Dựa trên nguồn cung cấp dữ liệu sẵn có đó; mà các nhà Data Analyst, Data Science có thể làm sạch, biến đổi và đưa ra kết quả phù hợp; từ đó giúp doanh nghiệp tiến hành hành động giải pháp thích hợp. Business Intelligence – BI là hệ thống vững chắc quản lý dữ liệu từ ban đầu đến khi hoàn thành; được xem như một công cụ không thể thiếu trong bất kì các công việc data nào

Business Reporting nói đơn giản là những báo cáo mà doanh nghiệp đang nắm trong tay. Và đây là quyền riêng tư, được bảo mật và tuyệt đối không chia sẻ; nếu không có sự cho phép của nhà lãnh đạo có quyền lực cao nhất trong doanh nghiệp. Bản báo cáo có thể bao gồm: báo cáo tài chính doanh nghiệp, bảng cân đối kế toán; các chiến dịch marketing – doanh thu và chi phí có liên quan, các thông tin; nhân khẩu học của khách hàng sử dụng sản phẩm/dịch vụ của doanh nghiệp. KPI Metrics là những chuẩn đo số lượng; dùng để đánh giá sự phát triển hay giật lùi của một doanh nghiệp trong một thời gian cụ thể (tháng, năm, quý)

Thuật ngữ quen thuộc – Data mining

Data mining là gì

Data mining hay Khai phá dữ liệu là quá trình phân loại, sắp xếp các tập hợp dữ liệu lớn; để xác định các mẫu và thiết lập các mối liên hệ nhằm giải quyết các vấn đề và là bước phân tích khó nhất trong quá trình Data Analytics, để có kiến thức chuyên sâu về data mining, bạn có thể tham khảo khóa học data analyst online. Các MCU khai phá dữ liệu cho phép các doanh nghiệp có thể dự đoán được xu hướng tương lai.

Quá trình khai phá dữ liệu là một quá trình phức tạp; bao gồm kho dữ liệu chuyên sâu cũng như các công nghệ tính toán. Hơn nữa, Data Mining không chỉ giới hạn trong việc trích xuất dữ liệu; mà còn được sử dụng để chuyển đổi, làm sạch, tích hợp dữ liệu và phân tích mẫu.

>> Tổng hợp toàn bộ thông tin và tài liệu về data mining

Các tính năng của Data Mining

Có nhiều tham số quan trọng khác nhau trong Data Mining; chẳng hạn như quy tắc kết hợp, phân loại, phân cụm và dự báo. Một số tính năng chính của Data Mining:

  • Classification: phân loại các dữ liệu theo một tiêu chuẩn nào đó.

Ví dụ: Bạn có 1 danh sách gồm họ và tên của 50 người khác nhau và bạn phân loại chúng thành những người có họ Trần, Nguyễn, Lê, Phạm,… với nhau

  • Clustering: phân loại các dữ liệu theo cụm một cụm.

Ví dụ: Cũng là danh sách trên, nhưng các bạn có thêm thông tin về nơi sinh; và bạn muốn phân cụm những người họ Trần ở TPHCM; tương tự đối với những người khác mà bạn muốn phân cụm

  • Prediction: dự đoán

Ví dụ: Tôi sẽ đổi sang một ví dụ khác để đỡ nhàm chán hơn. Khi bạn xem một biểu đồ tài chính, chứng khoán; bạn sẽ thấy giá cổ phiếu trong quá khứ, hiện tại và có dự đoán trong tương lai; nó không mang hàm ý tuyệt đối, nhưng cũng khá chính xác.

  • Association Rule: phân loại dữ liệu theo luật

Ví dụ: Nhiệm vụ của bạn là sắp xếp các tấm giấy màu vào các giỏ sao cho vừa đủ (không bị dư hay thừa giỏ nào); với quy luật: nếu xếp 1 tấm giấy đỏ vào giỏ thì bắt buộc phải xếp ít nhất 2 tấm giấy màu vàng vào cùng một giỏ. Nếu giỏ hàng nào có tấm giấy màu vàng; thì bắt buộc phải xếp ít nhất 1 tấm giấy màu xanh vào cùng giỏ đó;… Và đó chính là phân loại dữ liệu theo nguyên tắc được đề ra. Gần gũi hơn trong cuộc sống; khách hàng nào đã mua khuyến mãi thì không được sử dụng voucher.

Descriptive Analytics

 

Phân tích dữ liệu là gì?

Phân tích dữ liệu là gì trong Descriptive Analytics

Descriptive Analytics hay còn gọi là Phân tích mô tả là đặt câu hỏi “Chuyện gì đã xảy ra trong quá khứ”; thu thập tất tần tật toàn bộ các nguồn dữ liệu đã có sẵn trong quá khứ, thường là 1 năm.

Nhưng để đánh giá sâu và đúng đắn hơn khả năng thật sự của doanh nghiệp, tổ chức; thì lựa chọn 5 năm luôn được ưu tiên để có cái nhìn tổng quan. Các nguồn dữ liệu này cho ta thấy được những vấn đề mà chúng ta đã mắc phải trong quá khứ; những dữ liệu cho thấy tình hình kinh doanh đang đi lên hay xuống; đang phục hồi hay lâm vào khủng hoảng (recovery or crisis).

Predictive Analytics, Bigdata Analyst

Phân tích dự đoán cho biết điều gì có khả năng xảy ra. Nó sử dụng kết quả phân tích mô tả và chuẩn đoán để phát hiện xu hướng trong tương lai. Do đó, phân tích dự đoán trở thành công cụ để dự báo.

Phép phân tích này thường thấy rõ nhất ở các ngân hàng, công ty tài chính, sàn giao dịch bất động sản, sàn chứng khoán và sàn vàng. Bởi nhu cầu dự báo ở các lĩnh vực này rất cao; dù chỉ mang tính đoán trước sự việc xảy ra một cách có căn cứ chứ không hoàn toàn chính xác.

Thực chất, phân tích dự báo hiện nay không còn bó buộc trong lĩnh vực trên nữa; nó đã được mở rộng và phát triển ra nhiều hơn ở các mảng khác: F&B, Các công ty công nghệ, FMCG, Thời trang, Social Media… Vì dự báo xu hướng là một phần của xã hội; giúp chúng ta chuẩn bị tốt hơn và có những dự phòng chuẩn bị cho tương lai sắp tới.

Prescriptive Analytics – Phải làm gì

Nhờ sự kết hợp chặt chẽ của các loại phân tích ở trên mà Prescriptive Analytics (Phân tích đề xuất) – nhắc chúng ta phải làm gì kế tiếp; các hành động cụ thể kèm lí do và rủi ro có thể xảy ra; dựa trên các bước phân tích ở trên nhằm tối ưu hóa lợi nhuận; hạn chế các rủi ro có thể xảy ra cho doanh nghiệp