xs
xsm
sm
md
lg

2 AI “จีน” ท้ารบ “สหรัฐฯ” DeepSeek โค่น ChatGPT Alibaba ปล่อยของท้าชน

เผยแพร่:   ปรับปรุง:


DeepSeek สร้างสถิติยอดดาวน์โหลดทาง App Store โค่นผู้นำ ChatGPT ของสหรัฐฯ
สั่นสะเทือนกันไปทั้งโลก เมื่อสตาร์ทอัปสัญชาติจีน DeepSeek เปิดตัวผู้ช่วยเอไอแบบใช้งานฟรีมีต้นทุนต่ำ สร้างสถิติยอดดาวน์โหลดทาง App Store โค่นผู้นำ ChatGPT ของสหรัฐฯ ชั่วพริบตา การมาของ DeepSeek ยังทุบหุ้นเทคสหรัฐฯ-ยุโรปร่วงระนาว ความมั่งคั่งหดหายไปวันเดียวกว่า 34 ล้านล้านบาท ก่อนค่อย ๆ ฟื้นตัวกลับคืนมา


DeepSeek เป็นบริษัทสตาร์ทอัปขนาดเล็กที่ตั้งอยู่ในเมืองหางโจว ก่อตั้งในปี 2023 ซึ่งเป็นปีเดียวกับที่ Baidu เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวแรกของจีน แม้ว่าจะมีบริษัทเทคโนโลยีจีนจำนวนมากพัฒนาโมเดล AI ขึ้นเอง แต่ DeepSeek เป็นรายแรกที่ได้รับการยอมรับจากอุตสาหกรรมเทคโนโลยีสหรัฐฯ ว่ามีประสิทธิภาพทัดเทียม หรือแม้แต่เหนือกว่าโมเดลชั้นนำของยักษ์ใหญ่เทคโนโลยีอเมริกัน

ผู้ก่อตั้ง DeepSeek คือเหลียง เหวินเฟิง (Liang Wenfeng)ชายวัย 40 ปี ที่มีพ่อเป็นครูประถม เขาเกิดในปี ค.ศ. 1985 ที่มณฑลกวางตุ้ง ทางตอนใต้ของจีน สำเร็จการศึกษาปริญญาตรีด้านวิศวกรรมข้อมูลอิเล็กทรอนิกส์ และปริญญาโทด้านวิศวกรรมข้อมูลและการสื่อสาร จากมหาวิทยาลัยเจ้อเจียง

เส้นทางนักลงทุนและนักพัฒนาเอไอของเหลียงที่แตกต่างอย่างโดดเด่นคือ เขามีพื้นฐานด้านการเงินด้วย เหลียงและเพื่อนร่วมรุ่นอีกสองคนตัดสินใจก่อตั้งกองทุนเฮดจ์ฟันด์ชื่อ High-Flyer ในปี 2015 ซึ่งเป็นกองทุนที่ใช้แบบจำลองทางคณิตศาสตร์และเทคโนโลยี AI ในการวิเคราะห์ตลาดและตัดสินใจลงทุน กองทุนไฮฟลายเออร์ เติบโตอย่างรวดเร็ว โดยสามารถบริหารสินทรัพย์ได้ถึง 1 หมื่นล้านดอลลาร์สหรัฐฯ หรือราว 3.39 แสนล้านบาท ในปี 2019

ในปี 2021 ระหว่างที่ High-Flyer ประสบความสำเร็จ เหลียง เหวินเฟิง หันมาสนใจเทคโนโลยีเอไอโดยซื้อ GPU จาก Nvidia หลายพันชิ้นเพื่อสร้างคลัสเตอร์ชิปขนาดใหญ่ เพื่อฝึกโมเดล AI ในเวลานั้นแนวคิดของเขาถูกมองว่าเป็นแค่งานอดิเรก

ต่อมางานอดิเรกนี้เองที่กลายเป็นจุดเริ่มต้นของ DeepSeek บริษัทที่เขาก่อตั้งขึ้นในปี 2023 เพื่อพัฒนา AI ที่มีศักยภาพใกล้เคียงกับมนุษย์ หรือที่เรียกว่า Artificial General Intelligence (AGI) โดย เหลียง คัดเลือกทีมงานระดับหัวกะทิจากมหาวิทยาลัยชั้นนำ ทำให้ DeepSeek เป็นองค์กรคนรุ่นใหม่ไฟแรงที่ไม่ติดเรื่องเงินทุนเพราะมีกองทุนไฮฟลายเออร์ ซึ่ง เหลียง ร่วมก่อตั้งเป็นผู้สนับสนุน

DeepSeek เริ่มปล่อยของเมื่อเดือนพ.ย. 2023 ด้วยการเปิดตัว DeepSeek Coder โมเดลเอไอแบบ open-source โมเดลที่เชี่ยวชาญงานเขียนโค้ดคอมพิวเตอร์โดยเฉพาะ ต่อมาก็ปล่อย DeepSeek LLM โมเดลภาษาขนาดใหญ่ (Large Language Model : LLM) ขนาด 67B พารามิเตอร์ที่สามารถสื่อสารด้วยภาษามนุษย์ได้อย่างเป็นธรรมชาติออกมา

ถัดจากนั้น ในเดือน พ.ค. 2024 DeepSeek ปล่อย DeepSeek-V2 โมเดลเอไอประสิทธิภาพสูงต้นทุนต่ำราคาไม่แพง จุดชนวนสงครามราคาเอไอจีนที่ทำให้ยักษ์ใหญ่อย่างเทนเซนต์ อาลีบาบา ไบดู ไบแดนซ์ ต้องลดราคาเอไอลงมา

จาก DeepSeek Coder ตัวอัพเกรดอย่าง “DeepSeek Coder-V2” ตามมาด้วยโมเดลล่าสุด “DeepSeek-V3” และ “DeepSeek-R1” ที่เปิดตัวเมื่อวันที่ 20 ม.ค. 2025 ที่ผ่านมา โดย R1 ไม่เพียงแต่แสดงศักยภาพทางเทคนิคด้วยการประมวลผลที่รวดเร็วกว่าเดิมถึง 2 เท่า แต่ยังลดต้นทุนการฝึกโมเดลลงได้ถึง 30% เทคโนโลยีนี้สร้างความตื่นตะลึงในวงการเอไอของโลก

และเมื่อยอดดาวน์โหลด DeepSeek ทาง App Store แซงหน้า ChatGPT ของสหรัฐฯ ถล่มทลาย ในวันที่ 27 ม.ค. 2025 ราคาหุ้นเทคสหรัฐฯและยุโรปต่างร่วงระนาว ดัชนี Nasdaq ดิ่งลง 3.1% หุ้นบิ๊กเทคอย่าง Nvidia ดิ่งรูด 17% มูลค่าตลาดหายไปถึง 593,000 ล้านดอลลาร์สหรัฐ ซึ่งถือเป็นการสูญเสียมูลค่าตลาดภายในวันเดียวมากที่สุดในประวัติศาสตร์ของตลาดหุ้นวอลล์สตรีท

สำหรับหุ้นบริษัทเทครายใหญ่อื่น ๆ ที่ปรับตัวลดลง ได้แก่ ผู้ผลิตชิป Broadcom (-17%) Microsoft ซึ่งเป็นผู้สนับสนุนรายใหญ่ของ ChatGPT (-2.1%) และ Alphabet บริษัทแม่ของ Google (-4.2%)

ทีมนักวิจัยของ DeepSeek ระบุในรายงานเมื่อเดือนที่แล้วว่า โมเดล DeepSeek-V3 ซึ่งเปิดตัวเมื่อวันที่ 10 ม.ค.2025 ใช้ชิป H800 ซึ่งเป็นรุ่นที่ Nvidia ลดสเปกลงเพื่อเอามาขายให้จีนในการฝึกฝนเอไอ และใช้ต้นทุนเพียงไม่ถึง 6 ล้านดอลลาร์สหรัฐฯหรือราวสองร้อยล้านบาท ต่ำกว่าคู่แข่งอย่าง OpenAI หรือ Google อย่างมาก

สำหรับโมเดล DeepSeek-R1 ที่ปล่อยออกสู่ท้องตลาด ใช้ต้นทุนต่ำกว่าโมเดล o1 ของ OpenAI ประมาณ 20-50 เท่า ขึ้นอยู่กับภารกิจที่เอไอได้รับมอบหมาย ตามข้อมูลบนบัญชี WeChat ทางการของ DeepSeek

แดเนียล มอร์แกนผู้จัดการพอร์ตโฟลิโออาวุโสจาก Synovus Trust Company ซึ่งถือหุ้นเกือบ 1 ล้านหุ้นใน Nvidia ตั้งข้อสังเกตว่าการที่โมเดลเอไอของ DeepSeek ถูกออกแบบมาเพื่อใช้งานในโทรศัพท์มือถือและคอมพิวเตอร์ PC เป็นหลักมากกว่าศูนย์ข้อมูล ทำให้มันกลายเป็นคู่แข่งที่น่ากลัวสำหรับ ChatGPT META.O และ Gemini ของค่าย Alphabet

ประธานาธิบดี โดนัลด์ ทรัมป์แห่งสหรัฐฯ มองว่าการผงาดของบริษัทสตาร์ทอัป DeepSeek สัญชาติจีนควรเป็นสัญญาณเตือนและแรงกระตุ้นให้อุตสาหกรรมเทคสหรัฐฯ ต้องยกระดับศักยภาพในการแข่งขันเพื่อให้ได้รับชัยชนะ นับเป็นเรื่องดีที่บริษัทจีนสามารถสร้างเครื่องมือเอไอที่มีประสิทธิภาพสูงและรวดเร็วขึ้นด้วยต้นทุนที่ต่ำลง

ด้านSatya Nadellaซีอีโอของ Microsoft มองบวกต่อปรากฏการณ์ DeepSeek-R1 ที่เป็นโอเพนซอร์สและใช้ทรัพยากรน้อย การใช้งานก็จะยิ่งแพร่หลาย กลายเป็นส่วนสำคัญในชีวิตประจำวัน เหมือนกับที่เราขาดอินเทอร์เน็ตไม่ได้ในปัจจุบัน

อย่างไรก็ดี Microsoft ที่ทำเป็นอวย DeepSeek ไม่ทันไร สำนักข่าวบลูกเบิร์ก รายงานว่า ไมโครซอฟท์และ OpenAI กำลังตรวจสอบว่ากลุ่มที่เกี่ยวข้องกับสตาร์ทอัพ AI สัญชาติจีน DeepSeek ได้รับข้อมูลจากเทคโนโลยีของ OpenAI อย่างไม่ถูกต้องหรือไม่ ซึ่งอาจส่งผลกระทบต่อความสัมพันธ์ระหว่างบริษัทเทคโนโลยีระดับโลกและสตาร์ทอัพ AI ในจีน

‘อาลีบาบา’ เปิดตัวโมเดลเอไอ Qwen 2.5-Max

เหลียง เหวินเฟิง ผู้ก่อตั้ง DeepSeek
ขณะที่Pat Gelsingerอดีตซีอีโออินเทล แสดงความเห็นในคืนวันจันทร์ (27) ที่ตลาดหุ้นสหรัฐฯ แตกตื่นกับข่าว DeepSeek จนทำให้หุ้นเทคร่วงระนาว โดยเขามองว่าตลาดหุ้นกำลังเข้าใจสถานการณ์ผิด ซึ่งกรณีของ DeepSeek เป็นการย้ำเตือนในกฎ 3 ข้อ ที่พวกเราต่างรู้กันอยู่แล้ว

นั่นคือการประมวลผลนั้นเป็นไปตามกฎของแก๊ส ยิ่งราคาถูกลง การเข้าถึงและขนาดตลาดก็จะขยายใหญ่ขึ้น ตลาดหุ้นกำลังเข้าใจผิดเรื่องนี้ เพราะ AI จะมีการใช้งานมากขึ้น, วิศวกรรมคือการทำงานบนข้อจำกัด เมื่อวิศวกรจีนถูกจำกัดทรัพยากร พวกเขาก็ต้องสร้างสรรค์วิธีใหม่ในการแก้ปัญหา และการเปิดกว้างคือผู้ชนะ DeepSeek กำลังเขย่าวงการ AI ที่พัฒนาโมเดลแบบปิด ด้วยวิธีโอเพนซอร์ส ต้องขอบคุณพวกเขา

ขณะเดียวกัน โฆษกของ NVIDIA มอง Deepseek ว่าความก้าวหน้าของวงการเอไอที่ยอดเยี่ยม R1 เป็นตัวอย่างที่สมบูรณ์แบบของเทคนิค Test Time Scaling ซึ่งแสดงให้เห็นว่าโมเดลเอไอใหม่ ๆ สามารถได้รับพัฒนาขึ้นด้วยการใช้โมเดลที่มีอยู่ทั่วไปและการประมวลผลที่สอดคล้องกับข้อกำหนดการควบคุมการส่งออก

ส่วนElon Muskซีอีโอของ Tesla และ SpaceX แสดงความกังขาต่อ DeepSeek ผ่านแพลตฟอร์ม X โดยไม่เชื่อว่า DeepSeek-V3 ซึ่งเป็นโมเดล AI รุ่นล่าสุดของบริษัทที่อ้างว่าใช้ชิป NVIDIA เพียง 2,000 ตัวในการฝึกฝนเท่านั้น โดยทั่วไปแล้วการพัฒนาโมเดลเอไอระดับสูงมักต้องใช้ชิปอย่างน้อย 16,000 ตัวขึ้นไป

อย่างไรก็ดี แม้แอปเอไอของ DeepSeek จะมีประสิทธิภาพสูงในการทดสอบการใช้เหตุผล แต่โมเดลของ DeepSeek กลับถูกจำกัดด้วยประเด็นความอ่อนไหวทางการเมืองของรัฐบาลจีน ยกตัวอย่างเช่น DeepSeek R1 ปฏิเสธที่จะตอบคำถามเกี่ยวกับเหตุการณ์สังหารหมู่ที่จัตุรัสเทียนอันเหมิน เรื่องซินเจียงอุยกรูย์ หรือแม้แต่เรื่องที่ว่าประธานาธิบดี สี จิ้นผิง จะรับมือกับทรัมป์ อย่างไร

หลัง DeepSeek จุดกระแสปฏิวัติวงการเอไอด้วยประสิทธิภาพที่เหนือกว่าและต้นทุนต่ำกว่า ทางยักษ์ใหญ่อาลีบาบา (Alibaba)ก็ถือฤกษ์วันตรุษจีน (29 ม.ค.) ประกาศเปิดตัว'Qwen 2.5-Max'โมเดลเอไอ ที่อาลีบาบา เคลมว่า เหนือว่า DeepSeek ทุกด้าน

“Qwen 2.5-Max มีประสิทธิภาพเหนือกว่า GPT-4o, DeepSeek-V3 และ Llama-3.1-405B เกือบทุกด้าน” หน่วยงานคลาวด์ของอาลีบาบา ประกาศผ่านบัญชี WeChat อย่างเป็นทางการ โดยโมเดลที่ถูกอ้างถึงเป็นโมเดลเอไอขั้นสูงสุดของ OpenAI และ Meta ตามรายงานของสำนักข่าวรอยเตอร์ส

การปล่อยของของอาลีบาบา สะท้อนถึงแรงกดดันที่เกิดจาก DeepSeek ซึ่งไม่เพียงปั่นป่วนวงการเทคโลก แต่คู่แข่งในประเทศก็นั่งไม่ติดเช่นกัน

การแข่งขันที่รุนแรงและเร่งด่วน ยังทำให้ ByteDance บริษัทแม่ของ TikTok เร่งปล่อยโมเดลเอไอที่เพิ่งอัปเดตคล้อยหลัง DeepSeek เปิดตัว R1 และอ้างว่ามีประสิทธิภาพเหนือกว่า o1 ของ Open AI ในการทดสอบ AIME (การวัดความสามารถในการเข้าใจและตอบสนองคำสั่งซับซ้อน)

ดร.สันติธาร เสถียรไทยชวนตั้งคำถามที่หลังการผงาดของ DeepSeek ซึ่งไม่เพียงทำให้ตลาดหุ้นปั่นป่วนทั่วโลก แต่อาจมีผลกระทบในวงกว้างตามมา กล่าวคือ การมาของ DeepSeek ทำให้มีคำถามว่าเทคโนโลยีเอไอของอเมริกายังนำโลกอยู่จริงไหม หรือจีนวิ่งไล่กวดทันแล้ว

คำถามคือ หากจีนตามทัน สหรัฐฯจะตอบโต้อย่างไร จะเพิ่มความเข้มข้นของสงครามการค้า และเทคโนโลยีเพื่อให้จีนเข้าถึงได้ยากขึ้นไปอีกหรือไม่ แต่ต้องไม่ลืมว่ายิ่งจำกัดการเข้าถึงชิป จะยิ่งทำให้จีนคิดค้นวิธีใหม่ในการสร้างเอไอได้ประหยัดกว่าเดิม หรือสหรัฐฯจะยิ่งทุ่มทุนยิ่งกว่าเดิมกับโครงการเอไอขนาดยักษ์อย่าง Stargate ที่มูลค่าที่ประกาศเกือบเท่าเศรษฐกิจไทยทั้งประเทศ

ขณะเดียวกัน การที่ Deepseek ใช้เงินในการพัฒนาเอไอน้อยกว่าพวกบริษัทเทคโนโลยีดัง ๆ ของอเมริกาประมาณ 20-30x และใช้ชิปที่ไม่ได้ “ทรงพลัง” เท่า ทำให้เกิดคำถามในหมู่นักลงทุนว่าการที่ต้องลงทุนไปหลายพันล้านเพื่อให้ได้ชิปที่รงพลังที่สุด จริง ๆ แล้ว มันจำเป็นหรือเปล่า สรุปเราจ่ายไปเพื่อซื้อ“เนื้อ” หรือ “ไขมัน”กันแน่? นี่อาจเป็นเหตุผลหนึ่งที่ทำให้หุ้นวงการเทคและอุตสาหกรรมที่เกี่ยวข้องตระหนกร่วงกันระนาว

อีกประเด็นที่เป็นศึกคุกรุ่นในวงการเทคโนโลยี คือ โมเดลแบบเปิด (Open source) ที่เสมือนเปิด ‘สูตรลับ‘หรือ โค้ดให้คนอื่นสามารถเอาไปศึกษา ใช้พัฒนาต่อยอดได้ กับ โมเดลแบบปิดที่ไม่ได้เปิดข้อมูลเหล่านี้ เช่น ChatGPT

Deepseek คือเป็นแบบเปิด จึงทำให้เกิดคำถามว่าโมเดลแบบเปิดนี้มันเจ๋งจนไล่กวดโมเดลแบบปิดที่ซ่อนสูตรลับของตัวเองแล้วหรือ? แต่ก็มีคำถามต่อไปอีกว่าแล้วต่อไป Deepseek จะยังเปิดสูตรตัวเองไปเรื่อย ๆ แบบนี้ไหม หรือวันดีคืนดีก็จะปิดและเก็บตังค์ค่าใช้แพง ๆ และ/หรือจะมีการเอาข้อมูลของ User ไปใช้อย่างไรเพราะบางคนก็ห่วงเรื่อง data governance

นอกจากนั้น ยังมีคำถามว่าวงการเอไอ ผู้นำได้เปรียบมากจริงไหม หากผู้ตามสามารถตามได้เร็วขนาดนี้และยังทำได้ในต้นทุนที่ต่ำกว่ามาก แบบนี้มันยังคุ้มที่จะลงทุนพัฒนาเพื่อเป็นผู้นำหรือไม่ เพราะผู้นำด้านเอไออาจถูกดิสทรัปง่ายกว่าที่คิด

สำหรับอนาคตของเอไอ ในมุมผู้พัฒนาและลงทุนกับเอไอ หากแต่ละประเทศต่างแข่งกันสร้างสุดยอดเอไออาจทำให้ต่างลดความสำคัญด้านการกำกับดูแลความเสี่ยง ทำให้ยิ่งมีโอกาสเกิดเอไอแบบอันตรายต่อสังคมขึ้นหรือไม่ คำถามเหล่านี้อาจทำให้ขนหัวลุก แต่ในมุมของผู้ใช้ พัฒนาการนี้ก็อาจมองในมุมบวกได้เช่นกัน เพราะเมื่อต้นทุนพัฒนาเอไอถูกลง ทำให้ค่าริการถูกลง คนเข้าถึงได้มากขึ้น

ถึงยุคที่เทคโนโลยีเอไอ กำลังเข้าใกล้การครองโลกขึ้นทุกขณะ
กำลังโหลดความคิดเห็น