ChatGPT là cái chi?

1. ChatGPT là gì?

ChatGPT là một công cụ xử lý ngôn ngữ tự nhiên được điều khiển bởi công nghệ AI, cho phép bạn trò chuyện gần giống như con người với con người. Nếu so sánh với những loại chatbot đang tồn tại trước đó thì ChatGPT “thông minh” hơn rất nhiều. ChatGPT có thể trả lời hầu hết các câu hỏi và hỗ trợ bạn thực hiện các tác vụ như tra cứu thông tin, giải toán, soạn email, vẽ tranh, viết luận, viết mã ... Ban đầu, nó được cung cấp miễn phí cho người sử dụng vì ChatGPT đang trong giai đoạn nghiên cứu và thu thập phản hồi, thu thập dữ liệu để cải thiện năng lực của nó. Kể từ ngày 1 tháng 2, đã xuất hiện một phiên bản đăng ký trả phí có tên ChatGPT Plus.
Từ khi xuất hiện, ChatGPT luôn được tung hô, được “thổi phồng” lên một cách “hơi quá”. Nếu xét về năng lực của các mô hình AI thì có thể phân thành 3 nhóm như sau:

  • Narrow AI (Weak AI, ANI): là những mô hình AI có khả năng thực hiện một tác vụ cụ thể nào đó, mô phỏng các hành vi của con người thông qua những kiến trúc model được thiết kế sẵn và được huấn luyện từ một tập dữ liệu đủ lớn. Phần lớn các ứng dụng AI đều thuộc dạng này, có thể kể đến như các hệ thống gợi ý (recommendation system), các trợ lý ảo (như Siri, Alexa, Google Assistant, v.v.), các mô hình nhận diện vật thể, và còn nhiều thứ khác nữa. Nói chung, các mô hình AI này đều nằm trong phạm vi kiểm soát của con người, bởi vì chúng chỉ thực hiện những tác vụ mà con người đặt ra, chúng chưa thể có nhận thức sâu và chưa đủ khả năng thực hiện đa tác vụ như một con người.
  • General AI (Strong AI, AGI): Trong khi Narrow AI đề cập đến những khả năng mà trí tuệ nhân tạo đã đạt được cho đến ngày nay, thì General AI đề cập đến khả năng của nó trong tương lai. Loại AI này có thể suy nghĩ và hoạt động giống như con người, bao gồm khả năng tự học, phân tích lựa chọn, trao đổi, đưa ra ý kiến, v.v.. Không những thế, nó còn có thể thực hiện đa tác vụ đồng thời một cách trơn tru và hiệu quả. Trên thế giới hiện nay, "công dân robot" đầu tiên trên thế giới Sophia có thể coi là đã tiệm cận khả năng này (tất nhiên vẫn còn cách khả năng của con người một khoảng khá xa).
  • Super AI (ASI): Siêu trí tuệ nhân tạo (ASI) là một thuật ngữ dùng để biểu thị một mô hình AI vượt quá khả năng nhận thức của con người ở mức độ lớn theo mọi cách có thể. Đây là một trong những lý thuyết xa vời nhất về trí tuệ nhân tạo nhưng thường được coi là mục tiêu cuối cùng của việc tạo ra AI. Chúng ta có thể bắt gặp loại AI này trong các bộ phim viễn tưởng, ví dụ như nhân vật Ultron trong phim Avengers.

ChatGPT thì cũng “ghê” rồi đấy, nhưng vẫn chưa đạt tới cảnh giới "General AI". Hiện nay mới chỉ có Sophia là tiệm cận General AI thôi. Chẳng qua là ChatGPT có ảnh hưởng trực tiếp đến nhiều người, ai cũng có thể “hưởng lợi” từ nó nên nó mới được tung hô nhiều đến như vậy.

2. Ai là người tạo ra ChatGPT?

ChatGPT được tạo bởi OpenAI, một công ty nghiên cứu về AI, có trụ sở tại San Francisco, Mỹ. Công ty đã ra mắt ChatGPT vào ngày 30 tháng 11 năm 2022.
Giám đốc điều hành (CEO) của OpenAI là Sam Altman, người trước đây là chủ tịch của Y Combinator.

Microsoft là đối tác và nhà đầu tư với số tiền 1 tỷ đô la. Họ đã cùng nhau phát triển Nền tảng Azure AI.

Ngoài ChatGPT, Open AI cũng tạo ra DALLE•2, một công cụ sáng tạo nghệ thuật sử dụng AI khá phổ biến và Whisper, một hệ thống nhận dạng giọng nói tự động.

3. ChatGPT phát triển nhanh như thế nào?

Ngay khi vừa ra mắt, ChatGPT đã gây được tiếng vang lớn. "ChatGPT is scary good. We are not far from dangerously strong AI", Elon Musk, một trong những người sáng lập OpenAI trước khi rời đi, cho biết. Sam Altman, giám đốc của OpenAI, cho biết trên Twitter rằng ChatGPT đã có hơn 1 triệu người dùng trong 5 ngày đầu tiên sau khi ra mắt. Altman nói với Musk rằng chi phí trung bình của mỗi phản hồi là "single-digits cents" nhưng thừa nhận rằng cuối cùng họ sẽ cần phải kiếm tiền từ nó vì chi phí tính toán "eye-watering" của nó.

Theo phân tích của ngân hàng Thụy Sĩ UBS, ChatGPT là ứng dụng phát triển nhanh nhất mọi thời đại. Vào tháng 1, chỉ hai tháng sau khi ra mắt, phân tích của UBS ước tính rằng ChatGPT có 100 triệu người dùng hoạt động. Để so sánh, phải mất 9 tháng để TikTok đạt được 100 triệu.

4. ChatGPT được đào tạo như thế nào?

Về khía cạnh kỹ thuật, ChatGPT thực chất là một mô hình ngôn ngữ lớn (LLM), được đào tạo với lượng dữ liệu khổng lồ để dự đoán chính xác từ nào tiếp theo trong câu.
Dữ liệu được dùng để đào tạo ChatGPT bao gồm các đoạn mã code, các thông tin từ internet (các nguồn như thảo luận Reddit, stackoverflow, wikimedia, ), các cuốn sách, và từ chính thông tin mà nó thu được trong quá trình hỏi đáp với người sử dụng. Chính vì thế ChatGPT học được cách đối thoại và phong cách phản hồi giống như con người.

5. Bản chất kỹ thuật của ChatGPT

ChatGPT thực chất là một mô hình ngôn ngữ lớn (LLM), mà cốt lõi của LLM lại là cơ chế Attention. Nhớ lại rằng, trước khi cơ chế Attention ra đời, các mô hình seq2seq với 2 khối encoder và decoder (tạo thành từ các lớp RNN) được sử dụng để thực hiện bài toán Neural Machine Translation (NMT).

Encoder sẽ có nhiệm vụ xử lý thông tin đầu vào và mã hóa những thông tin này thành những feature vectors. Những feature vectors này sẽ trở thành đầu vào của tầng Decoder.

Decoder sẽ có nhiệm vụ dựa vào đầu ra từ tầng Encoder để tìm ra phân phối xác suất từ các feature vectors, từ đó tìm ra label tương ứng. Nói nôm na là ánh xạ dữ liệu từ miền này qua miền khác.

Kiến trúc RNN tỏ ra khá hiệu quả đối với những câu văn ngắn, tuy nhiên, khi gặp những câu văn dài thì nó lại xảy ra hiện tượng vanishing gradient, tức là các trọng số không thể cập nhật được nữa (mô hình không học được nữa). LSTM xuất hiện để giải quyết được vấn đề này. Vậy nhưng, LSTM lại tốn rất nhiều thời gian để huấn luyện và nó cũng không thể mang những thông tin của toàn bộ các từ trong câu để ánh xạ sáng cho tầng Decoder được. Cơ chế Attention ra đời như là "cứu tinh" của bài toán này vậy.

Đúng như tên gọi, cơ chế này sẽ "tập trung" toàn bộ thông tin từ tầng Encoder về một mối để tạo ra một context vector thay vì chỉ sử dụng vector trạng thái ẩn của state cuối cùng để tạo ra vector biểu diễn cho decoder.

Hình 1 - Cơ chế Attention

Ngay sau khi cơ chế Attention ra đời, thì một model đã được sinh ra, tạo bước ngoặt lớn, làm biến đổi cả thế giới NLP. Đó chính là Transformer, được giới thiệu trong bài báo với cái tên huyền thoại: Attention is all you need. Những đặc điểm sau đã giúp Transformer "trở nên vĩ đại" và trở thành kiến trúc được rất nhiều nghiên cứu áp dụng:

  • Thứ nhất đó là ứng dụng thành công Attention, cụ thể là cơ chế self-attention. Theo đó, self-attention là cơ chế giúp cho encoder có thể "nhìn" được các từ xung quanh trong khi đang mã hoá một từ cụ thể, do đó, có thể hiểu được sự liên quan giữa các từ trong 1 câu bất kể khoảng cách có xa tới đâu.
Hình 2 - Cơ chế Self-Attention
  • Thứ hai đó là sự kết hợp giữa ưu điểm của CNN và ưu điểm của RNN, đó là tính toán song song bằng cách học chuỗi hồi tiếp với cơ chế tập trung, đồng thời mã hoá vị trí của từng phần tử trong chuỗi (thay vì xử lý các phần tử trong chuỗi một cách tuần tự). Điều này giúp Transformer có thể tận dụng được khả năng của GPU và giúp tiết kiệm thời gian huấn luyện hơn.
Hình 3 - 1 tầng Transformer

Có thể nói, cơ chế Attention và kiến trúc Transformer đã mở ra một thời đại mới cho các mô hình LLM. Một trong số đó có thể kể đến GPT-3, mô hình được coi là "cha đẻ" của ChatGPT. GPT-3 là thế hệ thứ 3 của "dòng họ" GPT, được phát triển bởi OpenAI. GPT-3 ứng dụng cơ chế Attention để tạo ra mô hình có khả năng sinh ngôn ngữ giống như người thật.

Nhìn chung, về mặt kỹ thuật, có thể nói ChatGPT không phải là một kiến trúc đủ mới để tạo bước ngoặt hay tiếng vang lớn như "ông tổ" Transformer đã từng.

6. Hạn chế của ChatGPT là gì?

6.1 ChatGPT có thể không trả lời được những câu hỏi mang tính “thời sự”

Bởi vì ChatGPT được huấn luyện trên dữ liệu lớn nên nó cần một khoảng thời gian để cập nhật lại. Như hiện tại, nó mới được học những dữ liệu từ năm 2021 trở về trước, nên nếu bạn hỏi nó về những sự kiện, nhân vật, … mới xuất hiện sau năm 2021, nó sẽ không thể trả lời được.

6.2 Chất lượng câu trả lời phụ thuộc vào nội dung câu hỏi

Chất lượng câu trả lời của ChatGPT phụ thuộc rất nhiều vào nội dung của câu hỏi đầu vào. Nội dung câu hỏi càng chi tiết thì câu trả lời của ChatGPT càng chính xác và ngược lại. Điều này thì có vẻ cũng đúng với cả con người hay các hệ thống hỏi đáp khác.

6.3 Câu trả lời không phải lúc nào cũng đúng

Một hạn chế khác là vì nó được đào tạo để cung cấp câu trả lời phù hợp với con người, nên câu trả lời có thể đánh lừa con người rằng kết quả đầu ra là chính xác.

Nhiều người dùng phát hiện ra rằng ChatGPT có thể đưa ra câu trả lời không chính xác, bao gồm một số câu trả lời cực kỳ sai.

Người điều hành tại trang web Hỏi & Đáp mã hóa Stack Overflow có thể đã phát hiện ra hậu quả không mong muốn của các câu trả lời mà con người cảm thấy đúng.

Stack Overflow tràn ngập phản hồi của người dùng được tạo từ ChatGPT có vẻ đúng, nhưng rất nhiều câu trả lời sai.

Hàng nghìn câu trả lời khiến nhóm điều hành viên tình nguyện choáng ngợp, khiến các quản trị viên ban hành lệnh cấm đối với bất kỳ người dùng nào đăng câu trả lời được tạo từ ChatGPT.

Hàng loạt câu trả lời về ChatGPT dẫn đến một bài đăng có tiêu đề: Chính sách tạm thời: ChatGPT bị cấm:

Trải nghiệm của người kiểm duyệt Stack Overflow với các câu trả lời ChatGPT sai nhưng có vẻ đúng là điều mà OpenAI, nhà sản xuất ChatGPT, nhận thức được và cảnh báo trong thông báo về công nghệ mới của họ.

6.4 OpenAI giải thích những hạn chế của ChatGPT
Thông báo OpenAI đưa ra cảnh báo này:

7. Các mô hình ngôn ngữ sẽ thay thế Tìm kiếm của Google?

Ngày 06/02/2023, Google đã công bố, chatbot Bard của họ (được "thừa hưởng" từ LaMDA, cũng là một LLM do Google xây dựng lên) đang trong quá trình thử nghiệm và đánh giá, sắp tới sẽ được công bố rộng rãi tới người dùng. Đồng thời, Baidu cũng đã công bố kế hoạch phát triển chatbot của riêng họ mang tên Ernie Bot. Có thể nhận định rằng, cuộc đại chiến chatbot giữa các ông lớn đã bắt đầu. Và tất nhiên, người hưởng lợi là chúng ta.

Một số người trên Twitter đã tuyên bố rằng ChatGPT sẽ là Google tiếp theo.

Kịch bản mà một ngày nào đó một chatbot hỏi và trả lời có thể thay thế Google đang gây sợ hãi cho những người kiếm sống bằng nghề tiếp thị tìm kiếm chuyên nghiệp.

Nó đã gây ra các cuộc thảo luận trong các cộng đồng tiếp thị tìm kiếm trực tuyến, như Phòng thí nghiệm SEOSignals nổi tiếng của Facebook, nơi ai đó đã hỏi liệu các tìm kiếm có thể chuyển từ công cụ tìm kiếm sang chatbot hay không.

Hiện tại, chưa thể khẳng định ChatGPT có thể thay thế hoàn toàn Google vì những hạn chế của nó. Công nghệ vẫn còn một chặng đường dài phía trước, nhưng có thể hình dung ra một tương lai mà việc tìm kiếm sẽ có sự kết hợp giữa Chatbot và các thuật toán tìm kiếm khác.

8. Kết luận

Nhìn chung mà nói, việc ChatGPT được phổ biến rộng rãi tới người dùng là một điều tốt, sẽ giúp cho mọi người có thể ứng dụng những lợi ích của AI vào trong công việc hằng ngày. Riêng đối với dân IT chúng ta, nếu biết cách sử dụng ChatGPT hợp lý, sẽ giúp chúng ta tăng năng suất công việc lên rất nhiều.
Tuy nhiên cá nhân mình có 1 số nhận xét như sau:

  • Thứ nhất là truyền thông đang thổi phồng về những gì ChatGPT đang làm được, trong khi lại không (hiếm) đề cập đến những hạn chế của nó.
  • Ngày càng có nhiều người đang phụ thuộc vào con chatbot này, cũng như có nhiều người lợi dụng con chatbot này để làm những việc sai trái. Nhiều trường học trên thế giới đã cấm sinh viên sử dụng ChatGPT, nhiều công cụ mới được tạo ra để phát hiện và ngăn chặn những gì được tạo ra bởi ChatGPT.

Công nghệ nào cũng có 2 mặt của nó, vì vậy, hãy có cái nhìn đúng đắn về AI nói chung, và ứng dụng AI một cách hợp lý nhất có thể để AI trở thành "trợ lý" đắc lực cho cuộc sống của chúng ta.

Nguồn tham khảo:

Bahdanau 2015
Attention is all you need
Sách: Dive into Deep Learning, chương 10, 11
What Are the Types of Artificial Intelligence: Narrow, General, and Super AI Explained
Google: An important next step on our AI journey
ChatGPT: Optimizing Language Models for Dialogue
viblo.asia
zdnet.com

Leave a Reply

Your email address will not be published. Required fields are marked *