Song song với sự phát triển của deep learning algorithms là sự phát triển của CPU (Computer Processing Unit). Vào tháng 3 năm 2023, Intel Core i9-13900KS có thể làm 6 tỷ phép tính trong 1 giây khi dùng trong máy tính bình thường; và 9 tỷ phép tính trong 1 giây khi người ta dùng liquid nitrogen và liquid helium để làm nguội CPU này (ở nhiệt độ - 269o C!). Mặt khác GPU (Graphics Processing Unit) nhanh hơn CPU 250 lần, khi được dùng để xử lý (process) deep learning algorithms! Ngoài ra, số lượng labelled data được dùng trong Large Language Models (dùng deep learning algorithms) trên toàn thế giới đã tăng trưởng dưới dạng lũy thừa (exponentially); người ta không thể làm thống kê được, mà chỉ ước đoán là vào năm 2025, con số này sẽ là 175 Zettabytes!
Trong bối cảnh đó, AI đang bắt đầu trưởng thành; người ta đã
chấp nhận 1 từ mới “AI” trong nhiều ngôn ngữ khác nhau, mà không cần phải giải
thích thêm. Khắp nơi trên thế giới người ta đã và đang đầu tư rất nhiều vào việc
phát triển AI. Riêng tại Hoa Kỳ, năm 2021, nhiều công ty đã đầu tư 160 tỷ Mỹ
kim và con số này được ước đoán sẽ tăng lên 1,600 tỷ Mỹ kim vào năm 2030. Vào
quý 1 năm 2023, OpenAI
đang dẫn đầu các công ty AI, mời xem thêm Top 10 AI technology startups to
watch in 2023. Sôi động
nhất là sự ra đời của ChatGPT vào cuối tháng 11 năm 2022. ChatGPT thành công
theo kiểu vô tiền khoán hậu vì chỉ trong vòng hơn 2 tháng,
ChatGPT đã có hơn 100 triệu người sử
dụng, bằng nhiều ngôn ngữ khác nhau.
ChatGPT là gì? Theo cách chiết tự, “Chat” là 1 phần của chữ “Chatbot”,
1 loại software robot giúp người ta “chat” (đối thoại) trên
Internet, y như người thật, dưới dạng 1 người hỏi - 1 người đáp, bằng cách gõ chữ (texting) hoặc bằng cách chuyển chữ sang tiếng nói
(text-to-speech). “GPT” là chữ viết tắt của “Generative Pre-trained
Transformer”, Google Translate dịch là “Máy biến áp được đào tạo trước” (hiểu được, chết liền!) trong khi ChatGPT giải thích như sau:
"Generative Pre-trained Transformer" có thể được dịch sang tiếng Việt là "bộ chuyển đổi được huấn luyện trước để tạo ra văn bản". Trong đó:
·
"Generative"
nghĩa là có tính sinh sáng, tức là khả năng tạo ra dữ liệu mới từ một mô hình
máy học đã học được các kiến thức từ dữ liệu huấn luyện.
·
"Pre-trained"
nghĩa là được huấn luyện trước đó, tức là mô hình đã được huấn luyện trên một tập
dữ liệu lớn để học các kiến thức về ngôn ngữ.
·
"Transformer"
là một kiến trúc mạng nơ-ron sử dụng trong bài toán xử lý ngôn ngữ tự nhiên, đặc
biệt là bài toán sinh văn bản.
Vì vậy,
"Generative Pre-trained Transformer" là một kiến trúc mạng nơ-ron được
huấn luyện trước đó để tạo ra văn bản mới.
ChatGPT rõ ràng đã “giỏi” hơn Google Translate, nhưng vẫn chưa có thể dịch ngắn gọn hơn. Bây giờ chúng ta đành phải tự tìm hiểu vậy.
Transformer là
1 khối software nhằm mục đích biến đổi input data thành output data, thí dụ như
biến đổi 1 câu hỏi (input) thành 1 câu trả lời (output). Biến đổi như thế nào
thì tùy theo cách thiết kế của software. Trong lãnh vực AI, nhất là trong lãnh
vực ngôn ngữ, software này bao gồm 1 mạng lưới, với
nhiều nút kết nối với nhau, tương tự như các giây thần kinh (neural network) trong não bộ. Mục đích chính là dùng data trong database để
đoán (statistics & probability) câu trả lời và cuối cùng sàng lọc
những kết quả không chính xác, trước khi cung cấp kết quả cuối cùng (final
answer). Câu trả lời cuối cùng được đưa tiếp vào database, vừa để tăng thêm kiến
thức cho database, vừa giúp tìm câu trả lời cho 1 vấn đề liên quan mau chóng
hơn, trong tương lai. Việc “dạy” cho database như vậy được gọi là pre-trained. Câu trả lời cuối cùng phải được
chuyển thành câu văn để giúp con người thấu hiểu (không như câu văn viết bằng
máy, ngô nghê, thô kệch); chức năng này được biết đến là (text) generating (hay
generative). Hiện giờ ChatGPT chỉ cung cấp output dưới dạng text, và
người ta phải dùng 1 vài AI apps khác (thí dụ như Generative AI)
để biến text thành hình ảnh (image generation), thành video (video generation), cung cấp data (mới) cho database
qua chức năng data augmentation …
Thông thường thì data trong AI database bao gồm những gì đã từng
được luân chuyển qua Internet - kể cả “fake news” – và những gì người ta tự thu
thập và gìn giữ làm của riêng. Mỗi công ty AI chọn database riêng cho họ, dưới
hình thức “cloud plaform” – 1 mạng lưới bao gồm nhiều máy
tính trên thế giới kết nối với nhau (mà không cần biết các máy tính ở đâu, cứ
coi như nó đang ở trên mây) với khả năng chứa rất nhiều dữ liệu và tính rất
nhanh. Một lợi thế của cloud platform là code và data nằm chung trong cùng 1 máy
tính, nên tốc độ chuyển data đạt được mức tối ưu. Mời bạn xem “10 Best Databases for Machine
Learning & AI” để
biết thêm về các loại database thông dụng hiện nay.
Hiện giờ AI chưa có chức năng phân biệt thật hay giả, nên kết
quả lấy từ AI chưa chắc đáng tin 100%; điều này khiến ChatGPT phải rào đón trước,
để không có ai có thể kiện cáo ChatGPT! Phiên bản hiện giờ của ChatGPT (tháng 5
năm 2023) được phát hành ngày 3 tháng 5 năm 2023, gồm 2 loại: loại miễn phí và
loại phải trả tiền ChatGPTPlus (USD 20/tháng). Ngày 16 tháng 3 năm 2023, OpenAI
công bố bản báo cáo kỹ thuật về phiên bản mới GPT-4 (còn có thêm
1 tên khác là “OpenAI (2023)”) với những cải tiến so với phiên bản trước (GPT
3.5):
·
Input
có thể dưới dạng image + text; nhưng output vẫn theo dạng text;
·
Không
nhận những câu hỏi có liên quan đến lãnh vực an ninh, khủng bố, kỳ thị …;
·
Kết
quả chính xác hơn, nhưng không hoàn toàn khả tín (dưới dạng “thấy dzậy mà hổng
phải dzậy” –
Hallucination
).
Hình trên, bên trái, là hình chụp 1 chú chó tật nguyền cưỡi chiếc xe lăn. Gần đây có người dùng ChatGPT và Midjourney V5 (AI image generator) để tạo hình trên, bên phải, trông giống như hình chụp, phải không? Nếu bạn thấy thú vị với ChatGPT, có lẽ bạn sẽ tự hỏi: mình có thể làm được việc gì với ChatGPT? Có lẽ sẽ có rất nhiều, nhưng người viết chưa tìm hiểu sâu và chỉ thử sử dụng trong 1 vài khía cạnh nhỏ, theo sở thích.
Một điều thú vị là mình có thể chat với ChatGPT bằng tiếng Việt
và tiếng Anh. Câu trả lời cho cùng 1 câu hỏi trong 2 ngôn ngữ khác nhau, có thể
khác nhau và nhờ đó bổ sung cho nhau (đây là 1 lợi thế cho người biết nhiều ngôn
ngữ!); thí dụ như “giải phương trình bậc 3” và “roots of cubic equation”. Bạn có
thể kiểm chứng câu trả lời của ChatGPT với Cubic Formula. Thừa thắng xông lên, bạn có thể hỏi ChatGPT “giải phương
trình bậc 4”, “roots of quartic equation” và kiểm kết quả với Quartic equation. 1 điểm son cho ChatGPT là họ đã giải thích rõ ràng,
không phải chỉ đưa ra công thức mà thôi.
Bạn có thể tham khảo ChatGPT về những đề tài khác, thí dụ như:
·
Tâm
linh: “linh hồn sẽ đi về đâu, sau khi chết”, “afterlife beliefs”
·
Vật
lý: “quỹ đạo parabol và áp dụng”
·
Kỹ
thuật & y học: “transdermal optical imaging”, “Hình ảnh quang học xuyên da”
·
Kỹ
thuật & máy tính: “how to destroy an SSD”
·
Âm
nhạc: “viết nốt nhạc bằng máy tính”
·
Hội
họa: “vẽ tranh bằng máy tính”
vân vân. Nếu bạn không hài lòng với câu trả lời của ChatGPT,
bạn có thể yêu cầu ChatGPT tạo ra 1 câu trả lời khác, cho đến khi ChatGPT “bí”.
Nếu bạn dùng Google để tìm câu trả lời cho các đề tài phía trên,
Google sẽ cung cấp cho bạn rất nhiều links và bạn phải mất khá nhiều thời gian
để đọc và sàng lọc kết quả. Trên bình diện này, ChatGPT đã thu ngắn thời gian tìm
kiếm và học hỏi những điều mới lạ.
Phiên bản tiếng Việt | Bản dịch của ChatGPT | Bản dịch của Google Translate |
||
---|---|---|---|---|
Tôi quen với anh chị Hải Bằng,
chị bằng lòng làm người mẫu cho tôi chụp bức hình ‘Vá cờ’ này. Tôi mua một cái
nón sắt ở chợ trời, mượn cây súng trường của anh bạn Bùi Ðức Lạc là cả một chuyện
khó khăn. Tôi dùng hai thứ đó làm hậu cảnh. Lá cờ được tôi đốt lỗ chỗ để chị ấy
vá. Chị cứ ngồi vá cờ và tôi cứ chụp. Ðến động tác như trong hình thì tôi nói
chị giữ nguyên động tác đó, tôi mở hé cửa sổ chỉ cho một phần ánh sáng rọi vào
lá cờ, rọi vào nón sắt. Tuyệt vời. Bức hình chỉ có một ý nghĩa duy nhất: Chúng
ta hãy vá lại những mảnh đời, những mảnh tình, những đơn vị chia rẽ, vá lại
tình đoàn kết. |
I'm
familiar with Mr. and Mrs. Hai Bang, and Mrs. Bang was willing to be a model
for me to take this 'Flag Patching' photo. I bought an iron hat at the market
and borrowed a rifle from my friend Bui Duc Lac, which was quite difficult. I
used these two things as the background. I burned holes in the flag and had her
patch them. She sat there patching while I took the pictures. When it came to
the pose in the picture, I told her to hold that pose and I opened the window a
bit to let the light shine on the flag and the iron hat. It was great. The
photo only has one meaning: Let's patch up our lives, our relationships, our
divided communities, and restore unity. |
I know Mr.
and Mrs. Hai Bang, she agreed to be a model for me to take this picture of
'Patch the flag'. I bought a helmet at the flea market, borrowing a rifle from
my friend Bui Duc Lac was a difficult thing. I use those two as the background.
The flag was burned by me for her to patch. You just sit and patch the flag and
I keep taking pictures. When it came to the movement as shown in the picture, I
told her to keep it, I opened the window a little to let a part of the light
shine on the flag, on the helmet. Great. The picture has only one meaning:
Let's patch up the pieces of life, the pieces of love, the divided units, the
solidarity. |
Dĩ nhiên là cả 2 phiên bản dịch sang tiếng Anh đều không hoàn
hảo; nhưng phiên bản của ChatGPT ít cần chỉnh sửa hơn. Nhận xét này có lẽ chỉ đúng
vào thời điểm hiện tại, bởi vì ChatGPT và Google Translate đều đang được cải
thiện theo thời gian.
Trong khi nhiều người còn đang tìm tòi, học hỏi về ChatGPT thì
YouTube càng ngày càng có thêm nhiều clips chỉ dẫn về việc dùng ChatGPT, và các
ứng dụng mới của ChatGPT; thí dụ như:
·
How To Use ChatGPT To Write A Book:
[Step-By-Step Guide]
·
How to use AI Art and ChatGPT to
Create a Insane Web Designs
·
Can ChatGPT Generate Circuit Components?
·
10X Your Code with ChatGPT: How to
Use it Effectively
·
How To Use ChatGPT To Make YouTube
Videos With Realistic AI Voice-Overs
·
AI
Can 3D Print Whatever You Ask For!
·
10 ChatGPT Life Hacks - THAT’LL
CHANGE YOUR LIFE !!
·
Is AGI here? ChatGPT + GPT-4 + Voice
= AutoGPT
và nhiều tin tức hấp dẫn khác.
Song song với sự ra mắt của ChatGPT, Microsoft loan báo họ vừa
trình làng phiên bản mới của Bing
Chat (chỉ mở được với Microsoft Edge) và mời mọi người thử nghiệm. Bing
Chat và Microsoft Translator dịch sang tiếng Anh bài "Vá Cờ" ở phía trên, như sau:
Phiên bản tiếng Việt | Bản dịch của Bing Chat | Bản dịch của Microsoft Translator |
||
---|---|---|---|---|
Tôi quen với anh chị Hải Bằng,
chị bằng lòng làm người mẫu cho tôi chụp bức hình ‘Vá cờ’ này. Tôi mua một cái
nón sắt ở chợ trời, mượn cây súng trường của anh bạn Bùi Ðức Lạc là cả một chuyện
khó khăn. Tôi dùng hai thứ đó làm hậu cảnh. Lá cờ được tôi đốt lỗ chỗ để chị ấy
vá. Chị cứ ngồi vá cờ và tôi cứ chụp. Ðến động tác như trong hình thì tôi nói
chị giữ nguyên động tác đó, tôi mở hé cửa sổ chỉ cho một phần ánh sáng rọi vào
lá cờ, rọi vào nón sắt. Tuyệt vời. Bức hình chỉ có một ý nghĩa duy nhất: Chúng
ta hãy vá lại những mảnh đời, những mảnh tình, những đơn vị chia rẽ, vá lại
tình đoàn kết. |
I am familiar with Hai Bang
and she is willing to be my model for this ‘Vá cờ’ photo. I bought an iron hat
at the flea market and borrowed a rifle from my friend Bui Duc Lac, which was a
difficult thing to do. I used those two things as the background. I burned
holes in the flag for her to sew. She sat there sewing the flag while I took
pictures. When it came to the pose in the picture, I told her to keep that pose
and I opened the window a little bit to let some light shine on the flag and on
the iron hat. It was great. The photo has only one meaning: Let’s patch up our
lives, our love, our divided units, and patch up our unity. |
I am acquainted with Hai Bang brother and sister, she
is willing to model for me to take this picture of 'Patching the flag'. I
bought an iron hat at the flea market, borrowing a rifle from my friend Bui Duc
Lac was a difficult task. I use those two as backgrounds. The flag was burned
by me for her to patch. She just sat and patched the flag and I kept shooting.
When it came to the gesture as shown in the picture, I told her to keep the
same movement, I opened the window to let only a part of the light shine on the
flag, shining on the iron hat. Excellent. The picture has only one meaning: Let
us patch up the pieces of life, the pieces of love, the divided units, the
solidarity. |
Bạn có thể hỏi Bing Chat những câu hỏi ở phía trên (cho
ChatGPT). Bạn sẽ nhận ra ngay 1 điểm khác biệt: câu trả lời của Bing Chat không
đi sâu vào chi tiết, nhưng ở cuối câu trả lời, Bing Chat hỏi xem bạn có hài lòng
hay không, và đưa ra 1 số “gợi ý” để bạn chọn và tiếp tục hỏi Bing Chat.
Gần đây Google tung ra thị trường (AI-powered chatbot) Bard và
dành cho người ở Anh quốc và Hoa Kỳ thử nghiệm. Người ở các xứ khác muốn thử
nghiệm Bard phải đánh lừa Bard bằng cách dùng VPN (Virtual
Private Network) để Bard không biết mình đang ở xứ nào và Bard sẽ đồng ý
cho mình kết nối qua Internet! Người viết chưa thử nghiệm nên không có ý kiến.
Như đã nói ở trên, AI đã và đang tăng trưởng đến mức độ không
ngờ, qua sự đóng góp của rất nhiều người trên thế giới. Không phải là “người
trong nghề” thì khó lòng mình theo kịp họ. Công ty OpenAI khét tiếng 1 thời, có
thể sẽ không giữ vững nổi ngôi bá chủ. Gần đây Elon Musk loan tin ông tách rời
OpenAI và mở công ty mới X.ai để cạnh tranh với OpenAI. Có người lo ngại rằng
trong 1 ngày không xa, AI sẽ phải nhường bước cho AGI (Artificial General
Intelligence) - 1 loại thông minh như con người, tự đặt ra câu hỏi và tự tìm cách
trả lời. Người ta lo ngại rằng nhân loại sẽ lâm vào tình trạng bị AI xỏ mũi và
con người phải sớm tỉnh thức và ngăn chận việc này càng sớm càng tốt. Vào ngày
4 tháng 5 2023, chính quyền Biden-Harris loan báo “New
Actions to Promote Responsible AI Innovation that Protects Americans’ Rights
and Safety”. Có người bình luận rằng ngay cả khi Hoa Kỳ thành công trong việc
kiểm soát mức bành trướng của AI trên lãnh thổ Hoa Kỳ, ai sẽ là cơ quan kiểm soát
AI trên toàn thế giới? Mặt khác, thoạt đầu thì công ty OpenAI được thành lập dưới
dạng “bất vụ lợi” (not-for-profit) và code họ dùng thuộc loại “open source”; nhưng
bây giờ công ty này đã trở thành “vụ lợi” (for profit) và software của họ đã trở
thành “tài sản trí tuệ” (intellectual property), không ai dám đụng vào. Quả là
1 vấn nạn mới trong thời đại mới, người viết không mong tìm được câu trả lời
khi thời gian còn lại không còn bao nhiêu.
Bây giờ, thay cho lời kết, mời bạn xem 1 video clip về AI app cho người khiếm thị, và 1 YouTube clip được trình làng ngày 20 tháng 4 năm 2023 Should We Be Fearful of Artificial Intelligence? w/ Emad Mostaque, Alexandr Wang, and Andrew Ng.
