Amazon muốn thu hẹp khoảng cách khoa học dữ liệu bằng cách đưa máy học lên đám mây

Các doanh nghiệp đang ngày càng tìm cách để thúc đẩy lợi nhuận của họ bằng cách khai thác dữ liệu họ thu thập.

Nhưng thật khó để các công ty trích xuất thông tin có ý nghĩa khi các nhà khoa học dữ liệu bị thiếu hụt.

Để đối phó với sự thiếu hụt kỹ năng này, các nhà cung cấp điện toán đám mây lớn đã thiết lập các dịch vụ theo yêu cầu để cung cấp cho các doanh nghiệp cơ hội bắt đầu với học máy.

Học máy là một kỹ thuật cho phép máy tính tìm kiếm các mẫu trong dữ liệu và cung cấp năng lượng cho các công cụ đề xuất trực tuyến đề xuất sách hoặc phim bạn có thể thưởng thức. Các công ty có thể sử dụng các mô hình học máy để đưa ra dự đoán hữu ích: chẳng hạn như 'Email này có phải là thư rác không?' hoặc 'Có bao nhiêu mặt hàng dự kiến ​​sẽ bán trong khu vực này?'

Tổng giám đốc AWS về khoa học dữ liệu Matt Wood Image: Amazon

Amazon, Microsoft và Google cung cấp các dịch vụ học máy theo yêu cầu thông qua các nền tảng đám mây tương ứng của họ, mỗi nền tảng có mức độ truy cập khác nhau cho các nhà phát triển mà không có nền tảng về thống kê.

Amazon đã sử dụng học máy từ những ngày đầu làm người bán sách trực tuyến, khi họ cần một cách để giúp các biên tập viên của con người chọn các đề xuất từ ​​thư viện mạnh một triệu của mình.

Matt Wood, tổng giám đốc khoa học dữ liệu tại Amazon Web Services (AWS) cho biết: "Chúng tôi đã quyết định từ rất sớm với tư cách là một tổ chức rằng việc học máy sẽ trở nên quan trọng khi việc kinh doanh của chúng tôi phát triển".

"Chúng tôi đã có một quyết định để đưa ra. Chúng tôi có muốn đi ra ngoài và thuê toàn bộ các chuyên gia và chuyên gia về máy học khi những người đó rất hiếm không? Đó là sự kết hợp rất hiếm của các kỹ năng thống kê, xác thực chéo, của thiết kế thuật toán. "

Thay vào đó, Amazon quyết định thuê một nhóm các chuyên gia máy học tương đối nhỏ để xây dựng một dịch vụ nội bộ mà tất cả các nhà phát triển của nó có thể sử dụng.

"Chúng tôi đã thấy sự đổi mới này bởi vì các nhà phát triển đã không phải dành cả đống thời gian cho việc học máy để có thể đưa lợi ích của mình vào sử dụng", ông nói, trích dẫn vai trò của dịch vụ trong các lĩnh vực như đáp ứng, năng lực lập kế hoạch, quản lý chuỗi cung ứng và xác định hàng giả.

Dịch vụ học máy công cộng do AWS cung cấp ngày nay dựa trên cùng các thuật toán mà công ty cung cấp cho nhân viên của mình. Khách hàng có thể xây dựng các mô hình học máy bằng cách sử dụng dữ liệu được lưu trữ trong Dịch vụ dữ liệu quan hệ của Amazon với phần phụ trợ MySQL, kho đối tượng S3 hoặc dịch vụ lưu trữ dữ liệu Redshift để đào tạo chúng.

Những mô hình này có thể được sử dụng để thực hiện các loại dự đoán khác nhau. Phân loại nhị phân được sử dụng để dự đoán một trong hai kết quả có thể xảy ra - 'Email này có phải là thư rác hay không?'. Phân loại nhiều lớp để dự báo một trong ba kết quả có thể trở lên và khả năng của từng loại - 'Sản phẩm này là một cuốn sách, một bộ phim hay một bài báo về quần áo?'. Hồi quy được sử dụng để dự đoán một con số - 'Nhiệt độ có thể là ngày mai là bao nhiêu?'.

Dịch vụ cũng sẽ cố gắng tự động xác thực dữ liệu và, nếu có thể, chuyển đổi nó thành một hình thức hữu ích hơn, ví dụ như trích xuất mã ZIP hoặc mã bưu điện từ một địa chỉ.

Khi mô hình được xây dựng, các nhà phát triển có thể truy cập nó thông qua bảng điều khiển AWS hoặc các lệnh gọi API, cho phép các dự đoán được đưa đến một ứng dụng hoặc dịch vụ trực tuyến. Các mô hình có thể được điều chỉnh tốt bằng cách sử dụng thanh trượt trong giao diện điều khiển.

"Nhà phát triển cần biết rất, rất ít về học máy. Các chương trình học máy được quản lý bởi dịch vụ", Wood nói.

Các dịch vụ dựa trên đám mây như thế này giúp giảm bớt khó khăn khi thử nghiệm học máy, giảm thời gian và tiền bạc để học các kỹ năng để bắt đầu, ông nói.

Amazon đã thử nghiệm dịch vụ giúp các nhà phát triển bắt đầu với việc học máy dễ dàng hơn như thế nào, giao nhiệm vụ cho hai nhà phát triển không có nền tảng học máy để xây dựng mô hình dự đoán giới tính của một người từ tên của họ.

Phải mất một tháng để các nhà phát triển xây dựng mô hình của họ, được đào tạo sử dụng dữ liệu điều tra dân số và dự đoán giới tính với độ chính xác 92%. Ngược lại, một nhà phát triển không có kiến ​​thức học máy 20 phút để xây dựng mô hình tương tự với độ chính xác dự đoán tương tự bằng dịch vụ của Amazon.

Điều đó không có nghĩa là các dịch vụ đám mây này phù hợp với nhu cầu học máy của mọi người.

Đối với một, trong khi họ có thể giảm chi phí để bắt đầu, chúng có thể tốn kém để sử dụng trong thời gian dài. Dịch vụ của Amazon có thể có giá trong khu vực khoảng 100 đô la cho một triệu dự đoán.

Như một doanh nhân đã nói: "Điều này sẽ thực sự tốt khi sử dụng khi tôi khởi nghiệp, nhưng nó rất tốn kém ngay cả với ngân sách rất lớn."

Dịch vụ này cũng đã rút ra những lời chỉ trích về việc khóa người dùng, với dịch vụ không cho phép người dùng xuất và nhập mô hình.

"Tôi không thấy bất kỳ công ty nào có ý thức sẽ khóa mô hình dự đoán của họ vào AWS", như một người dùng trên diễn đàn nhà phát triển Hacker News nói.

Bất chấp những chỉ trích về dịch vụ còn non trẻ này, Wood tin rằng nó sẽ dẫn đến nhiều thử nghiệm hơn với máy học tại các công ty mà trước đây không biết bắt đầu từ đâu.

"Chìa khóa cho tôi là năng suất và đảm bảo các nhà phát triển có quyền truy cập vào công cụ này."

© Copyright 2020 | mobilegn.com