Снимка: Istock
Google представи нова технология, наречена TurboQuant, която променя начина, по който се обработват моделите за изкуствен интелект. Вместо да разчита на все повече хардуер и памет, както досега, алгоритъмът използва по-агресивна компресия на данните, така че големите езикови модели да работят с много по-малко ресурс.
Конкретно, технологията позволява:
– до 6 пъти по-малко използвана памет при работа на AI модели
– до 8 пъти по-бързо изпълнение при inference (работата на модела в реално време)
– значително по-ниска цена за обучение и поддръжка на AI системи
С други думи, това е преход от модел „повече чипове = повече AI“ към модел „по-умен софтуер = същия или по-добър резултат с по-малко хардуер“.
И точно тук идва пазарният шок — ако AI може да прави същото с по-малко памет, логичният първичен извод е, че търсенето на памет и сторидж може да се забави. Именно този страх предизвика рязката разпродажба в акции като Micron, SK Hynix и други.
Истинската тема обаче не е самата технология, а въпросът дали ефективността ще намали търсенето… или ще го ускори още повече.
Пазарната реакция към новината за TurboQuant на Google изглежда като типичен технологичен парадокс — не толкова отражение на реална промяна в търсенето, колкото момент на преоценка на наратива. Спадовете при компании като Micron, Western Digital, Seagate и Kioxia не идват от вече настъпила слабост, а от страх, че основният двигател на цикъла — експлозивното търсене на памет за AI — може да се окаже по-малко интензивен.
Фактите обаче показват по-сложна картина. Google представя алгоритъм, който намалява нуждата от памет до шест пъти и ускорява inference процесите до осем пъти. На повърхността това изглежда като директен удар върху memory сегмента. Но тук се появява класическият Jevons парадокс — когато една технология става по-ефективна, тя не намалява потреблението, а го увеличава, защото прави приложението ѝ по-достъпно.
Точно това е ключовият структурен момент. AI не е пазар с фиксирано търсене. Той е експоненциална функция на достъпността. Ако разходите за inference паднат, това не означава по-малко AI, а повече use cases, повече модели, повече заявки и в крайна сметка повече инфраструктура.
Исторически това вече се е случвало. При преминаването от 32-bit към 4-bit модели също имаше страх от спад в хардуерното търсене. Вместо това, използването на AI се ускори, а хардуерният цикъл се разшири. Същата логика се наблюдава и при cloud инфраструктурата през последното десетилетие — по-ниската цена на изчисленията доведе до експлозия в търсенето.
Тук трябва да се направи разграничение между краткосрочна пазарна реакция и структурна динамика. В краткосрочен план движението изглежда като класическо „profit-taking“ след агресивен ръст — Kioxia с над 700% покачване за месеци е ясен пример. При такива движения всяка новина, която поставя под въпрос темпа на растеж, действа като катализатор за корекция.
В средносрочен план обаче ограничението остава от страна на предлагането. Анализаторите ясно подчертават, че supply constraints в memory сегмента са все още доминиращ фактор. Това означава, че дори при подобрена ефективност, търсенето няма да спадне, защото системата вече работи при недостиг.
По-важният извод е, че AI индустрията започва да навлиза във втора фаза. Първата беше „scale at any cost“ — повече GPU, повече памет, повече капацитет. Втората е „efficiency at scale“ — оптимизация на ресурси, алгоритмична компресия и по-добро използване на съществуващия хардуер.
Това не убива хардуерния цикъл. То го трансформира.
В този нов режим победителите няма да бъдат просто тези, които произвеждат най-много чипове, а тези, които са интегрирани в цялата система — от архитектура до софтуер. Именно затова Nvidia остава централна, защото контролира не само хардуера, но и екосистемата.
За Европа този процес има различно значение. Европейските компании в полупроводниковия сектор са по-малко експонирани към масовото производство на памет и повече към нишови, високоспециализирани технологии — литография, индустриални чипове, автомобилни решения. Това означава, че те са по-слабо засегнати от краткосрочни страхове около memory цикъла, но и по-слабо позиционирани да се възползват от експлозивния AI растеж.
Така се оформя глобално разделение. САЩ и Азия доминират в скалата и скоростта на AI инфраструктурата. Европа остава по-скоро в ролята на инфраструктурен доставчик и технологичен посредник.
Пазарът в момента реагира на новината като на риск за търсенето. Но по-дълбокият прочит е различен. Това не е сигнал за спад в AI инвестициите, а за тяхната еволюция — от brute force към оптимизация.
Историята тук не е в това, че ще се използва по-малко памет. Историята е, че AI става по-евтин, а когато една технология стане по-евтина, тя почти винаги става по-голяма.
Посоката е ясна, но скоростта на адаптация ще определи кои компании ще задържат маржовете си и кои ще бъдат притиснати от новия цикъл на ефективност.
Материалът е с аналитичен и образователен характер и не е съвет за покупка или продажба на активи на финансовите пазари.
Google представи нова технология, наречена TurboQuant
Експерти: Инвеститорите подценяват иранския риск!
Ще видим ли спад за S&P 500 повече от 10%?
Скрит мечи пазар: 70% от акциите вече са в корекция, но индексите още не го показват
Лари Финк предупреди за „глобална рецесия“, ако петрола достигне 150 долара
| Валута | Цена | Δ% |
|---|---|---|
| EURUSD | 1.16 | ▼0.08% |
| USDJPY | 159.51 | ▲0.08% |
| GBPUSD | 1.33 | ▼0.11% |
| USDCHF | 0.79 | ▲0.13% |
| USDCAD | 1.38 | ▲0.12% |
| Референтен индекс | Цена | Δ% |
|---|---|---|
| Dow 30 | 46 554.80 | ▼0.19% |
| S&P 500 | 6 617.38 | ▼0.20% |
| Nasdaq 100 | 24 271.40 | ▼0.21% |
| DAX 30 | 22 924.20 | ▼0.82% |
| Криптовалута | Цена | Δ% |
|---|---|---|
| Bitcoin | 70 039.60 | ▼1.77% |
| Ethereum | 2 122.20 | ▼2.11% |
| Ripple | 1.38 | ▼2.01% |
| Фючърс | Цена | Δ% |
|---|---|---|
| Петрол - лек суров | 92.96 | ▲2.09% |
| Петрол - брент | 99.70 | ▲1.63% |
| Злато | 4 454.54 | ▼0.97% |
| Сребро | 25.68 | ▲1.17% |
| Пшеница | 601.12 | ▲0.70% |
| Срочност | Цена | Δ% |
|---|---|---|
| US 10 Year | 110.56 | ▼0.21% |
| Germany Bund 10 Year | 125.52 | ▼0.25% |
| UK Long Gilt Future | 88.66 | ▲1.42% |