Giới thiệu Machine Learning trên Microsoft Azure

Trước khi tìm hiểu về Machine Learning (hay còn gọi là máy học, tuy nhiên tôi ở đây giữ nguyên tên gọi tiếng Anh) trên Microsoft Azure, trước tiên ta tìm hiểu khái niệm cơ bản về Machine Learning và lịch sử hình thành của nó.

Machine Learning là gì?

Machine Learning là sử dụng máy tính và các thuật toán để đưa ra các mô hình dự đoán, có thể học hỏi từ những dữ liệu hiện có để dự đoán hình vi trong tương lai, kết quả và xu hướng.

Những dự đoán hay dự báo từ Machine Learning có thể giúp cho các ứng dụng và các thiết bị trở nên thông minh hơn. Ví dụ, khi bạn mua sắm trực tuyến, Machine Learning giúp giới thiệu các sản phẩm khác bạn có thể ưa thích, dựa vào những gì bạn đã xem qua hoặc đã mua, hoặc khi bạn dùng thẻ tín dụng (credit card) để thanh toán. Machine Learning sẽ so sánh giao dịch với một số cơ sở dữ liệu của các giao dịch trước đó để giúp ngân hàng phân tích và phát hiện gian lận trong việc giao dịch.

Quy trình của một Machine Learning
Quy trình của một Machine Learning

Như hình dưới là ví dụ điển hình khi tôi search trên trang web Amazon để tìm sách có nội dung liên quan từ khóa Azure và tôi chọn 1 cuốn sách để xem, ngay tại lúc đó hệ thống của Amazon cũng đồng thời đề nghị tôi những cuốn sách liên quan đến nội dung tôi đang tìm kiếm.

Amazon website
Amazon website

Sau khi ta đã biết khái niệm sơ qua về Machine Learning là gì, chúng ta tự hỏi Machine Learning ra đời vào lúc nào và lịch sử hình thành của nó đến bây giờ phát triển được những gì?

Lịch sử Machine Learning

1950 – Nhà bác học Alan Turing đã tạo ra “Turing Test (phép thử Turing)” để xác định xem liệu một máy tính có trí thông minh thực sự hay không. Để vượt qua bài kiểm tra đó, một máy tính phải có khả năng đánh lừa một con người tin rằng nó cũng là con người.

1952 – Arthur Samuel đã viết ra chương trình học máy (computer learning) đầu tiên. Chương trình này là trò chơi cờ đam, và hãng máy tính IBM đã cải tiến trò chơi này để nó có thể tự học và tổ chức những nước đi trong chiến lược để giành chiến thắng.

1957 – Frank Rosenblatt đã thiết kế mạng nơron (neural network) đầu tiên cho máy tính, trong đó mô phỏng quá trình suy nghĩ của bộ não con người.

1967 – Thuật toán “nearest neighbor” đã được viết, cho phép các máy tính bắt đầu sử dụng những mẫu nhận dạng (pattern recognition) rất cơ bản. Nó được sử dụng để vẽ ra lộ trình cho một người bán hàng có thể bắt đầu đi từ một thành phố ngẫu nhiên nhưng đảm bảo anh ta sẽ đi qua tất cả các thành phố khác theo một quãng đường ngắn nhất.

1979 – Sinh viên tại trường đại học Stanford đã phát minh ra giỏ hàng “Stanford Cart” có thể điều hướng để tránh các chướng ngại vật trong một căn phòng.

1981 – Gerald Dejong giới thiệu về khái niệm Explanation Based Learning (EBL), trong đó một máy tính phân tích dữ liệu huấn luyện và tạo ra một quy tắc chung để nó có thể làm theo bằng cách loại bỏ đi những dữ liệu không quan trọng.

1985 – Terry Sejnowski đã phát minh ra NetTalk, nó có thể học cách phát âm các từ giống như cách một đứa trẻ tập nói.

1990s – Machine Learning đã dịch chuyển từ cách tiếp cận hướng kiến thức (knowledge-driven) sang cách tiếp cận hướng dữ liệu (data-driven). Các nhà khoa học bắt đầu tạo ra các chương trình cho máy tính để phân tích một lượng lớn dữ liệu và rút ra các kết luận – hay là “học” từ các kết quả đó.

1997 – Deep Blue của hãng IBM đã đánh bại nhà vô địch cờ vua thế giới.

2006 – Geoffrey Hinton đã đưa ra một thuật ngữ “deep learning” để giải thích các thuật toán mới cho phép máy tính “nhìn thấy” và phân biệt các đối tượng và văn bản trong các hình ảnh và video.

2010 – Microsoft Kinect có thể theo dõi 20 hành vi của con người ở một tốc độ 30 lần mỗi giây, cho phép con người tương tác với máy tính thông qua các hành động và cử chỉ.

2011 – Máy tính Watson của hãng IBM đã đánh bại các đối thủ là con người tại Jeopardy.

2011 – Google Brain đã được phát triển, và mạng deep nơron (deep neural network) của nó có thể học để phát hiện và phân loại nhiều đối tượng theo cách mà một con mèo thực hiện.

2012 – X Lab của Google phát triển một thuật toán machine learning có khả năng tự động duyệt qua các video trên YouTube để xác định xem video nào có chứa những con mèo.

2014 – Facebook phát triển DeepFace, một phần mềm thuật toán có thể nhận dạng hoặc xác minh các cá nhân dựa vào hình ảnh ở mức độ giống như con người có thể.

2015 – Amazon ra mắt nền tảng machine learning riêng của mình.

2015 – Microsoft tạo ra Distributed Machine Learning Toolkit, trong đó cho phép phân phối hiệu quả các vấn đề machine learning trên nhiều máy tính.

2015 – Hơn 3.000 nhà nghiên cứu AI và Robotics, được sự ủng hộ bởi những nhà khoa học nổi tiếng như Stephen Hawking, Elon Musk và Steve Wozniak (và nhiều người khác), đã ký vào một bức thư ngỏ để cảnh báo về sự nguy hiểm của vũ khí tự động trong việc lựa chọn và tham gia vào các mục tiêu mà không có sự can thiệp của con người.

2016 – Thuật toán trí tuệ nhân tạo của Google đã đánh bại nhà vô địch trò chơi Cờ Vây, được cho là trò chơi phức tạp nhất thế giới (khó hơn trò chơi cờ vua rất nhiều). Thuật toán AlphaGo được phát triển bởi Google DeepMind đã giành chiến thắng 4/5 trước nhà vô địch Cờ Vây.

              (Nguồn lịch sử machine learning sưu tầm từ techmaster.com)

Machine Learning trên Microsoft Azure

Azure Machine Learning là một dịch vụ phân tích, dự đoán dựa trên nền tảng đám mây của Microsoft. Nó giúp chúng ta nhanh chóng tạo và triển khai các mô hình dự báo và cách giải pháp phân tích dữ liệu một cách nhanh chóng hiệu quả.

Machine Learning trước kia yêu cầu các phần mềm phức tạp, hệ thống máy tính cao cấp và các nhà khoa học đầy kinh nghiệm để hiểu nó. Đối với các công ty startup hoặc ngay cả các doanh nghiệp lớn quá đắt đỏ và phức tạp. Azure Machine Learning đã thổi luồng không khí mới vào dịch vụ machine learning, giúp nó trở nên dễ tiếp cận hơn. Azure Machine Learning cho phép người dùng không có hiểu biết sau về khoa học dữ liệu cũng có thể truy cập dữ liệu cho mục đích dự đoán và dự báo.

Đồng thời với Azure Machine Learning, chúng ta không cần phải bận tâm về phần mềm hay phần cứng, môi trường và các dịch vụ đi kèm. Chỉ với trình duyệt và kết nối Internet, chúng ta có thể truy cập vào Azure và bắt đầu phát triển các mô hình dự đoán và mô hình phân tích trong thời gian nhanh nhất. Azure Machine Learning cũng cho phép chúng ta lưu trữ không giới hạn số lượng file trên Azure Storage, và kết nối đồng bộ với cá dịch vụ liên quan đến Azure, bao gồm: HDInsight, giải pháp và dữ liệu lớn dựa trên nền Hadoop, SQL Server database và máy ảo.

Vai trò của Azure trong quy trình Machine Learning.
Vai trò của Azure trong quy trình Machine Learning.

Nhìn hình trên ta thấy Machine Learning Studio, góp phần quan trọng trong toàn bộ giải pháp Machine Learning trên Azure. Machine Learning Studio cung cấp môi trường làm việc trực quan, dễ dàng xây dựng kiểm tra và xây dựng mô hình phân tích, dự đoán mà không cần đòi hỏi phải biết lập trình. Chúng ta có thể kéo thả các dataset và các module phân tích một cách trực quan. Tuy nhiên để có thể mở rộng hơn bạn cần phải sử dụng các ngôn ngữ lập trình như R hoặc Python. Bạn có thể đăng kí 1 tài khoản Azure để thử nghiệm miễn phí với 200$

hoặc https://studio.azureml.net để đăng kí sử dụng.

Azure Machine Learning Studio
Azure Machine Learning Studio

Bài viết tiếp theo chúng ta sẽ tiếp tục tìm hiểu các khái niệm và thuật ngữ về Machine Learning và tutorial đầu tiên sử dụng Machine Learning Studio.

 

Huỳnh Công Danh

Anh Huỳnh Công Danh có 10 năm kinh nghiệm về lĩnh vực phần mềm với hơn 4 năm kinh nghiệm làm việc về quản lý CNTT cho chính phủ tại Sở Thông Tin và Truyền Thông Đồng Nai. Anh Danh hiện đang công tác tại Base Business Solution, chịu trách nhiệm chính trong việc tư vấn các giải pháp phần mềm có sử dụng Machine Learning. Đến với AzureVN.NET, anh Danh mong muốn được chia sẻ và thảo luận về việc triển khai các giải pháp sử dụng Machine Learning trên Microsoft Azure.

danh has 1 posts and counting.See all posts by danh

Leave a Reply

Your email address will not be published. Required fields are marked *