DeepSeek
DeepSeek | |
|---|---|
| Տեսակ | Սթարթափ և տեխնոլոգիական ընկերություն |
| Հիմնադրված է | մայիս 2023[1] |
| Հիմնադիր | Liáng Wénfēng?[2] |
| Վայր | Հանչժոու, Չինաստան |
| Երկիր | |
| Արդյունաբերություն | IT, արհեստական բանականություն և խոշոր լեզվական մոդել |
| Մայր ընկերություն | High-Flyer? |
| Սեփականատեր | High-Flyer? |
| Կայք | deepseek.com(չին.) և deepseek.com/en(անգլ.) |
Հանճոու Դիփսիկ Արհեստական Բանականություն Հիմնական Տեխնոլոգիաների Հետազոտությունների Ընկերություն (անգլ.՝ Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.)[3][4][5], առավել հայտնի որպես Դիփսիկ (անգլ.՝ DeepSeek), չինական ընկերություն, որը մասնագիտացած է մեծ լեզվական մոդելների (LLM) մշակման մեջ։ Գտնվելով Չժեցզյան նահանգի Հանճոու քաղաքում՝ Դիփսիկը պատկանում և ֆինանսավորվում է չինական Հայ-Ֆլայեր (անգլ.՝ High-Flyer) ֆոնդի կողմից։ Ընկերությունը հիմնադրվել է 2023 թվականի հուլիսին Լիան Վենֆենի կողմից, ով Հայ-Ֆլայերի համահիմնադիրն է և միաժամանակ երկու ընկերությունների գլխավոր տնօրենը (CEO)[6][7][8]: 2025 թվականի հունվարին Դիփսիկը թողարկեց իր DeepSeek-R1 մոդելը և համանուն DeepSeek Chat չատբոտը։
DeepSeek-R1-ը թողարկված է MIT լիցենզիայի ներքո և տրամադրում է պատասխաններ, որոնք համեմատելի են ժամանակակից այլ խոշոր լեզվական մոդելների հետ, ինչպիսիք են OpenAI-ի GPT-4-ը և o1-ը[9]։ Ընկերությունը հայտարարել է, որ իր V3 մոդելը վերապատրաստվել է ընդամենը 6 մլն ԱՄՆ դոլար ծախսերով, ինչը զգալիորեն ցածր է OpenAI-ի GPT-4-ի համար 2023 թվականին կատարված 100 մլն դոլար ծախսերից: Բացի այդ, այն օգտագործել է մոտ տասնապատիկ պակաս հաշվողական ռեսուրսներ՝ համեմատած Meta-ի համադրելի Llama 3.1 մոդելի հետ[10][11][12][13]։ DeepSeek-ի հաջողությունը ավելի խոշոր և հաստատված մրցակիցների նկատմամբ, բնութագրվել է որպես «արհեստական բանականության ռազմավարության շրջադարձ»[14][15]։
DeepSeek-ի մոդելները նկարագրվում են որպես «բաց կշիռ» (անգլ.՝ open weight), ինչը նշանակում է, որ ճշգրիտ պարամետրերը հանրությանը հասանելի են, սակայն օգտագործման որոշ պայմաններ տարբերվում են ավանդական բաց կոդով ծրագրերից[16][17]։ Ընկերությունը հրավիրում է արհեստական բանականության հետազոտողների Չինաստանի առաջատար համալսարաններից, ինչպես նաև՝ մասնագետներ ոչ միայն համակարգչային գիտությունից, այլև այլ բնագավառներից՝ իր մոդելների գիտելիքներն ու հնարավորություններն ընդլայնելու նպատակով:
DeepSeek-ը զգալիորեն կրճատել է իր R1 մոդելի ուսուցման ծախսերը՝ օգտագործելով այնպիսի մեթոդներ, ինչպիսին է փորձագետների խառնուրդ (MoE) շերտերը[18]: Բացի այդ, ընկերությունը կարողացել է վերապատրաստել իր մոդելները՝ չնայած Չինաստանին արհեստական բանականության (AI) չիպերի արտահանման սահմանափակումներին, օգտագործելով արտահանման համար նախատեսված ավելի թույլ AI չիպեր և դրանց ավելի քիչ քանակ[19]: Դիտորդները նշում են, որ այս առաջընթացը «ցնցող ալիքներ» է առաջացրել արդյունաբերությունում՝ սպառնալով հաստատված AI սարքավորումների արտադրողներին, ինչպիսին է Nvidia-ն: Այս իրադարձությունների արդյունքում Nvidia-ի բաժնետոմսերի գինը կտրուկ անկում ապրեց՝ կորցնելով 600 մլրդ ԱՄՆ դոլար շուկայական արժեք, ինչը դարձել է ԱՄՆ ֆոնդային շուկայի պատմության մեջ ամենամեծ միանգամյա անկումը մեկ ընկերության համար[20][21]:
Արտաքին հղումներ
[խմբագրել | խմբագրել կոդը]- DeepSeek GitHub-ում
- DeepSeek Hugging Face-ում
- Official API documentation
- Anthology of DeepSeek papers
- Research blog of High-Flyer
Ծանոթագրություններ
[խմբագրել | խմբագրել կոդը]- ↑ All About DeepSeek - The Chinese AI Startup Challenging The US Big Tech // Forbes / S. Forbes — NYC: Forbes, 2025. — ISSN 0015-6914; 2609-1445
- ↑ https://en.wikipedia.org/wiki/Liang_Wenfeng
- ↑ «Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd». Bloomberg L.P.
- ↑ «DeepSeek Coder Model Service Agreement» (PDF), DeepSeek, 2023 թ․ հոկտեմբերի 19, Արխիվացված (PDF) օրիգինալից 2025 թ․ փետրվարի 21-ին, Վերցված է 2025 թ․ փետրվարի 11-ին
- ↑ «DeepSeek Coder Privacy Policy» (PDF). DeepSeek. Վերցված է 2025 թ․ փետրվարի 19-ին.
- ↑ Jiang, Ben (2025 թ․ հունվարի 21). «Beijing puts spotlight on China's new face of AI, DeepSeek's Liang Wenfeng». South China Morning Post (անգլերեն). Արխիվացված օրիգինալից 2025 թ․ հունվարի 21-ին. Վերցված է 2025 թ․ մարտի 4-ին.
- ↑ Baptista, Eduardo (2025 թ․ հունվարի 28). «Who is Liang Wenfeng, the founder of DeepSeek?». Reuters (ամերիկյան անգլերեն). Արխիվացված օրիգինալից 2025 թ․ փետրվարի 19-ին. Վերցված է 2025 թ․ մարտի 4-ին.
- ↑ «Behind DeepSeek lies a dazzling Chinese university». The Economist. ISSN 0013-0613. Արխիվացված օրիգինալից 2025 թ․ փետրվարի 24-ին. Վերցված է 2025 թ․ մարտի 5-ին.
- ↑ Gibney, Elizabeth (2025 թ․ հունվարի 23). «China's cheap, open AI model DeepSeek thrills scientists». Nature (անգլերեն). 638 (8049): 13–14. Bibcode:2025Natur.638...13G. doi:10.1038/d41586-025-00229-6. ISSN 1476-4687. PMID 39849139. Արխիվացված օրիգինալից 2025 թ․ հունվարի 29-ին. Վերցված է 2025 թ․ հունվարի 27-ին.
{{cite journal}}: Check|pmid=value (օգնություն) - ↑ Vincent, James (2025 թ․ հունվարի 28). «The DeepSeek panic reveals an AI world ready to blow». The Guardian.
- ↑ Metz, Cade; Tobin, Meaghan (2025 թ․ հունվարի 23). «How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants». The New York Times (ամերիկյան անգլերեն). ISSN 0362-4331. Արխիվացված օրիգինալից 2025 թ․ հունվարի 23-ին. Վերցված է 2025 թ․ հունվարի 27-ին.
- ↑ Cosgrove, Emma (2025 թ․ հունվարի 27). «DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending». Business Insider. Արխիվացված օրիգինալից 2025 թ․ հունվարի 29-ին. Վերցված է 2025 թ․ հունվարի 27-ին.
- ↑ Erdil, Ege (2025 թ․ հունվարի 17). «How has DeepSeek improved the Transformer architecture?». Epoch AI (անգլերեն). Արխիվացված օրիգինալից 2025 թ․ փետրվարի 3-ին. Վերցված է 2025 թ․ փետրվարի 3-ին.
- ↑ Metz, Cade (2025 թ․ հունվարի 27). «What is DeepSeek? And How Is It Upending A.I.?». The New York Times (ամերիկյան անգլերեն). ISSN 0362-4331. Արխիվացված օրիգինալից 2025 թ․ հունվարի 27-ին. Վերցված է 2025 թ․ հունվարի 27-ին.
- ↑ Roose, Kevin (2025 թ․ հունվարի 28). «Why DeepSeek Could Change What Silicon Valley Believes About A.I.». The New York Times (ամերիկյան անգլերեն). ISSN 0362-4331. Արխիվացված օրիգինալից 2025 թ․ հունվարի 28-ին. Վերցված է 2025 թ․ հունվարի 28-ին.
- ↑ Delbert, Caroline (2025 թ․ հունվարի 31). «DeepSeek Is Cracking the 'Black Box' of Corporate AI Wide Open». Popular Mechanics. Արխիվացված օրիգինալից 2025 թ․ փետրվարի 13-ին. Վերցված է 2025 թ․ փետրվարի 12-ին.
- ↑ Gibney, Elizabeth (2025 թ․ հունվարի 23). «China's cheap, open AI model DeepSeek thrills scientists». Nature. 638 (8049): 13–14. Bibcode:2025Natur.638...13G. doi:10.1038/d41586-025-00229-6. PMID 39849139. Արխիվացված օրիգինալից 2025 թ․ հունվարի 29-ին. Վերցված է 2025 թ․ փետրվարի 12-ին.
{{cite journal}}: Check|pmid=value (օգնություն) - ↑ Metz, Cade (2025 թ․ փետրվարի 12). «How Did DeepSeek Build Its A.I. With Less Money?». The New York Times (անգլերեն). Արխիվացված օրիգինալից 2025 թ․ մարտի 19-ին. Վերցված է 2025 թ․ մարտի 21-ին.
- ↑ Allen, Gregory C. (2025 թ․ մարտի 7). «DeepSeek, Huawei, Export Controls, and the Future of the U.S.-China AI Race». Center for Strategic and International Studies.
- ↑ Saah, Jasper (2025 թ․ փետրվարի 13). «DeepSeek sends shock waves across Silicon Valley». Liberation News – The Newspaper of the Party for Socialism and Liberation. Արխիվացված օրիգինալից 2025 թ․ փետրվարի 17-ին. Վերցված է 2025 թ․ փետրվարի 13-ին.
- ↑ Sillars, James (2025 թ․ հունվարի 28). «DeepSeek: Tech firm suffers biggest drop in US stock market history as low-cost Chinese AI company bites Silicon Valley». Sky News. Վերցված է 2025 թ․ փետրվարի 13-ին.