Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI

0
0

Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AI của họ


Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI (Ảnh: Tech Spot)

Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AI sáng tạo của họ. Không chịu thua kém, Mark Zuckerberg và Meta đang phát triển một mô hình ngôn ngữ AI mới có tên LLaMA. Mô hình này được báo cáo là vượt trội so với GPT-3 trong hầu hết các điểm chuẩn.

Được công bố trong một bài đăng trên blog vào thứ Sáu, Mô hình ngôn ngữ lớn Meta AI (LLaMA) của Meta được thiết cho các nhóm nghiên cứu. Theo Meta, với kích thước chỉ bằng 10% của GPT-3 (Máy biến áp được đào tạo trước thế hệ thứ ba), mô hình LLaMA cung cấp một tài nguyên nhỏ nhưng hiệu suất cao có thể được tận dụng bởi ngay cả những nhóm nghiên cứu nhỏ nhất.

Kích thước mô hình này đảm bảo rằng các nhóm nhỏ với nguồn lực hạn chế vẫn có thể sử dụng mô hình và đóng góp vào những tiến bộ tổng thể của AI và học máy.

Cách tiếp cận của Meta với LLaMA khác biệt rõ rệt khi so sánh với ChatGPT của OpenAI, Bard của Google hoặc Prometheus của Microsoft. Công ty đang phát hành mô hình mới theo giấy phép phi thương mại, nhắc lại cam kết đã nêu về sự công bằng và minh bạch của AI. Truy cập cho các nhà nghiên cứu trong các tổ chức trên toàn chính phủ, học viện quan tâm đến việc tận dụng mô hình sẽ phải xin giấy phép và được cấp quyền truy cập.

Những nhà nghiên cứu nào xin được giấy phép thành công sẽ có quyền truy cập vào mô hình nền tảng nhỏ, dễ tiếp cận của LLaMA. Meta đang cung cấp LLaMA với một số tham số kích thước bao gồm 7B, 13B, 33B và 65B. Công ty cũng đã phát hành thẻ mô hình LLaMA trên GitHub, cung cấp thêm thông tin chi tiết về chính mô hình đó và các nguồn dữ liệu đào tạo công khai của Meta.

 Theo thông tin đưa ra, mô hình này đã được đào tạo bằng CCNet (67%), C4 (15%), GitHub (4,5%), Wikipedia (4,5%), Sách (4,5%), ArXiv (2,5%) và Stack Exchange ( 2%).

Mặc dù đây là một mô hình nền tảng có khả năng thích ứng với một số trường hợp sử dụng khác nhau, nhưng công ty thừa nhận rằng những ẩn số liên quan đến thành kiến và các bình luận độc hại vẫn là một mối đe dọa cần được cải thiện. Hy vọng của công ty là việc chia sẻ mô hình nhỏ nhưng linh hoạt này sẽ dẫn đến những cách tiếp cận mới có thể hạn chế hoặc trong một số trường hợp loại bỏ các con đường khai thác mô hình tiềm năng.

Những người quan tâm có thể tải tài liệu nghiên cứu LLaMA hoàn chỉnh từ blog Meta Research. Những người quan tâm đến việc đăng ký quyền truy cập có thể làm như vậy trên mẫu yêu cầu trực tuyến của Meta.

 

 (theo Viettimes)


Ý kiến bạn đọc


Lời cảm ơn của gia đình Tổng Bí thư Nguyễn Phú Trọng

Chiều 26/7, ông Nguyễn Trọng Trường, đại diện gia đình Tổng Bí thư Nguyễn Phú Trọng đọc Lời cảm ơn của gia đình Tổng Bí thư tại Lễ Truy điệu.

Bức tâm thư của Phu nhân Tổng Bí thư Lào gửi Phu nhân Tổng Bí thư

(VnMedia) - VnMedia xin đăng tải toàn văn bức tâm thư của Phu nhân Tổng Bí thư Lào Naly Sisoulith gửi Phu nhân Tổng Bí thư Nguyễn Phú Trọng, Ngô Thị Mận.

Nhớ về một người Cộng sản chân chính

(VnMedia)- Mỗi khi nghĩ về Tổng Bí thư Nguyễn Phú Trọng là trong tôi hiện lên hình ảnh một người Cộng sản chân chính. Và, lúc này, tôi lại nhớ đến câu chuyện mẹ tôi vẫn kể trong những năm tháng bà còn sống về cha tôi - một người Cộng sản...

Cảnh báo chiêu trò lừa đảo tuyển người mẫu, cầu thủ nhí trên không gian mạng

(VnMedia) - Bộ Công an vừa phát đi cảnh báo về chiêu trò lừa đảo tuyển mẫu nhí, cầu thủ nhí, người đại diện thương hiệu nhằm chiếm đoạt tài sản qua không gian mạng.

Giá vàng đảo chiều tăng mạnh

(VnMedia) - Chốt phiên giao dịch rạng sáng nay (24/7), giá vàng giao ngay tại thị trường New York đã đảo chiều tăng mạnh hơn 13 USD/ounce. Trong nước, chiều qua, giá vàng miếng SJC vẫn duy trì ở mốc gần 80 triệu đồng/lượng ở chiều bán ra.