VinBigdata - Mô hình ngôn ngữ lớn tiếng Việt, đặt nền tảng công nghệ AI tạo sinh

VinBigdata xây dựng mô hình ngôn ngữ lớn tiếng Việt: Đặt nền tảng cho công nghệ tạo sinh AI. Bạn có biết rằng, công ty VinBig Data (Tập đoàn Vingroup) đã công bố xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, đặt nền móng cho việc xây dựng các giải pháp tích hợp AI tạo sinh? Đây là một bước tiến quan trọng trong lĩnh vực công nghệ AI của Việt Nam, cũng như của thế giới. Trong bài viết này, tôi sẽ cùng các bạn tìm hiểu về công ty VinBigdata, mô hình ngôn ngữ lớn tiếng Việt, và các sản phẩm ứng dụng AI tạo sinh mà họ sắp ra mắt.

Công ty VinBigdata là gì?

Công ty Vin Bigdata là một công ty con của Tập đoàn Vingroup, chuyên về nghiên cứu và phát triển các giải pháp trí tuệ nhân tạo (AI) cho các lĩnh vực khác nhau. Công ty được thành lập vào năm 2018, với sứ mệnh trở thành trung tâm nghiên cứu AI hàng đầu của Việt Nam và khu vực.

Công ty Vin Bigdata có đội ngũ nhân sự gồm nhiều chuyên gia, nhà khoa học, kỹ sư hàng đầu trong lĩnh vực AI, được đào tạo từ các trường đại học danh tiếng trong và ngoài nước. Công ty cũng có sự hợp tác chặt chẽ với các tổ chức nghiên cứu uy tín trên thế giới, như Đại học Stanford, Đại học Cornell, Đại học Oxford, hay Viện Công nghệ Massachusetts (MIT).

VinBigdata sẽ tích hợp công nghệ để đưa VinBase trở thành nền tảng AI tạo sinh đầu tiên tại Việt Nam
VinBig data sẽ tích hợp công nghệ để đưa VinBase trở thành nền tảng AI tạo sinh đầu tiên tại Việt Nam

Công ty Vin Bigdata đã và đang cung cấp ra thị trường nhiều sản phẩm và dịch vụ ứng dụng AI cho các lĩnh vực như y tế, giáo dục, bán lẻ, an ninh,… Một số sản phẩm tiêu biểu của công ty là:

  • VinBrain: Nền tảng AI cho y tế thông minh, giúp phát hiện và chẩn đoán bệnh, hỗ trợ quyết định lâm sàng, và nâng cao chất lượng chăm sóc sức khỏe.
  • VinEdu: Nền tảng AI cho giáo dục thông minh, giúp cá nhân hóa học tập, kiểm tra và đánh giá năng lực, và nâng cao chất lượng giáo dục.
Hứa hẹn ViGPT trong tương lai
Hứa hẹn ViGPT trong tương lai
  • VinShop: Nền tảng AI cho bán lẻ thông minh, giúp quản lý hàng hóa, phân tích thị trường và khách hàng, và tăng doanh thu bán hàng.
  • VinFace: Nền tảng AI cho nhận diện khuôn mặt, giúp xác thực danh tính, phát hiện trộm cắp, và cải thiện an ninh.

Mô hình ngôn ngữ lớn tiếng Việt - chìa khóa cho AI tạo sinh

Mô hình ngôn ngữ lớn (LLM) là mô hình được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản hoặc hình ảnh khổng lồ. Mô hình này có khả năng hiểu tri thức, tự tạo văn bản và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. Đây được xem như chìa khóa để phát triển công nghệ AI tạo sinh (Generative AI) - Công nghệ đứng đằng sau sự thành công của các giải pháp đột phá như ChatGPT, Chatbot Grok hay Gauss.

ChatGPT là một ứng dụng chatbot được xây dựng bởi OpenAI, một tổ chức nghiên cứu AI phi lợi nhuận của Mỹ. ChatGPT có thể trò chuyện với người dùng về bất kỳ chủ đề nào, từ tin tức, giải trí, thể thao cho đến khoa học, triết học hay yêu đương. ChatGPT được xem như một trong những chatbot thông minh và tự nhiên nhất hiện nay.

Tuy nhiên, ChatGPT chỉ có thể trò chuyện bằng tiếng Anh, và không hiểu được các thông tin đặc thù của Việt Nam. Vì vậy, Vin Bigdata đã quyết định xây dựng một mô hình ngôn ngữ lớn tiếng Việt, dựa trên những bước tiến của ChatGPT, nhưng tập trung vào dữ liệu của người Việt và tri thức Việt.

Vivi trợ lí ảo
Vivi trợ lí ảo

Theo Giáo sư Vũ Hà Văn, Giám đốc Khoa học Công ty Vin Bigdata, mô hình ngôn ngữ lớn tiếng Việt của Vin Bigdata đã giải quyết được ba vấn đề cốt lõi: cải thiện tính chính xác, giảm chi phí hạ tầng tính toán một cách tối đa và đảm bảo tính bảo mật. Thay vì cần tới khoảng 100 tỷ tham số như ChatGPT-5 thì Vin Bigdata có thể tạo ra mô hình ngôn ngữ lớn với vài tỷ tham số nhưng vẫn có khả năng sinh ra các văn bản có tính xác thực cao.

Mô hình ngôn ngữ lớn tiếng Việt là mô hình ngôn ngữ lớn được đào tạo trên tập dữ liệu tiếng Việt, bao gồm các văn bản từ các nguồn khác nhau, như báo chí, văn học, luật pháp, y tế, giáo dục,… Mô hình này có khả năng sinh ra các văn bản có tính xác thực cao, tập trung vào dữ liệu của người Việt và tri thức Việt.

Mô hình ngôn ngữ lớn tiếng Việt của Vin Bigdata đã được xây dựng thành công với ba ưu điểm cốt lõi:

  • Cải thiện tính chính xác: Mô hình có độ chính xác cao trong việc sinh ra các văn bản có liên quan đến các chủ đề đặc thù của Việt Nam, như quy định, văn bản pháp luật, lịch sử, văn hóa, danh lam thắng cảnh, đặc sản địa phương,…
  • Giảm chi phí hạ tầng tính toán: Mô hình có kích thước nhỏ gọn và hiệu quả, chỉ cần vài tỷ tham số để hoạt động, so với khoảng 100 tỷ tham số của ChatGPT. Điều này giúp giảm thiểu chi phí và thời gian để huấn luyện và triển khai mô hình.
  • Đảm bảo tính bảo mật: Mô hình được xây dựng trên nền tảng công nghệ riêng của Vin Bigdata, không sử dụng các công cụ hay dịch vụ của bên thứ ba. Điều này giúp bảo vệ dữ liệu và thông tin của người dùng khỏi rò rỉ hay xâm phạm.
Vi Zone phân tích hình ảnh thông minh
Vi Zone phân tích hình ảnh thông minh

Các sản phẩm ứng dụng AI tạo sinh của VinBigdata

Với việc xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, Vin Bigdata đã mở ra nhiều khả năng mới cho việc phát triển các sản phẩm ứng dụng AI tạo sinh. Công nghệ này sẽ giúp tăng tính tự nhiên trong giao tiếp của máy, đồng thời hỗ trợ người dùng tìm kiếm, tổng hợp thông tin một cách nhanh chóng và đơn giản hơn nhiều so với trước đây.

Dự kiến cuối tháng 12/2023, Vin Bigdata sẽ chính thức ra mắt cộng đồng hai dòng sản phẩm chính. Đó là:

  • Nền tảng AI tạo sinh đa nhận thức VinBase 2.0: Đây là nền tảng trí tuệ nhân tạo toàn diện, tích hợp các công nghệ AI tạo sinh cho các loại dữ liệu khác nhau, như văn bản, hình ảnh, âm thanh, video,… Nền tảng này sẽ cung cấp các giải pháp phục vụ cho các doanh nghiệp, cơ quan chính phủ, và cá nhân, trong các lĩnh vực như y tế, giáo dục, bán lẻ, an ninh, giải trí,…
  • Ứng dụng ViGPT - “ChatGPT phiên bản Việt”: Đây là ứng dụng cho phép người dùng trò chuyện với một trợ lý ảo thông minh, có khả năng hỏi đáp các thông tin đặc thù của Việt Nam, hoặc các thông tin mang tính bản địa. Ứng dụng này sẽ được mở cho cộng đồng truy cập và thử nghiệm.
VinDr hình ảnh số hóa y tế
VinDr hình ảnh số hóa y tế

 

Bigdata
Bigdata

Với việc trở thành đơn vị đầu tiên tại Việt Nam hoàn thiện mô hình ngôn ngữ lớn tiếng Việt, Vin Bigdata đang góp phần tích cực thúc đẩy sự phát triển của các ngành khoa học công nghệ của Việt Nam nói chung và cạnh tranh song phẳng với các công ty công nghệ trên thế giới. Điều này khẳng định vị thế và tiềm năng của Việt Nam trong lĩnh vực Trí tuệ Nhân tạo và công nghệ tạo sinh AI. Hy vọng bài viết này đã giúp bạn có cái nhìn tổng quan và sâu sắc hơn về công ty VinBigdata, mô hình ngôn ngữ lớn tiếng Việt, và các sản phẩm ứng dụng AI tạo sinh của họ.

Quỳnh TTM

Content

Quỳnh TTM là kỹ thuật viên sửa chữa thiết bị điện tử công nghệ, điện thoại Smartphone, máy tính bảng, laptop, tai nghe...hơn 10 năm hoạt động chuyên môn và kinh nghiệm trong lãnh vực này.

Hỏi đáp (0 lượt hỏi và trả lời)

Đánh giá của bạn :

Thông tin bình luận