Tom's HardwareTechnologie

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Kopieren Sie den Link Kopieren Sie den Link Facebook X WhatsApp Reddit Pinterest Flipboard E-Mail Diesen Artikel 0 In den Dialog einsteigen Uns als bevorzugte Quelle bei Google hinzufügen Newsletter Abonnieren Sie unseren Newsletter Eine Forschungsgruppe, zu der auch Huawei Technologies gehört, hat das vollständige Nachtraining V4-Pro abgeschlossen, einem Modell mit 1,6 Billionen Parametern.

7. Juni 2026 Luke James Live Redaktion
Huawei-led team claims it post-trained DeepSeek's 1.6-trillion-parameter model — 1,000 Ascend 910C chips used in training

Kurzfassung

Warum das wichtig ist

Tom's HardwareTechnologie
  • Kopieren Sie den Link Kopieren Sie den Link Facebook X WhatsApp Reddit Pinterest Flipboard E-Mail Diesen Artikel 0 In den Dialog einsteigen Uns als bevorzugte Quelle bei Google hinzufügen Newsletter Abonnieren Sie unseren Newsletter Eine Forschungsgruppe, zu der auch Huawei Technologies gehört, hat das vollständige Nachtraining V4-Pro abgeschlossen, einem Modell mit 1,6 Billionen Parametern.
  • Laut der Stadtregierung, wie Post berichtet, verwendete die Gruppe dafür einen Cluster 1.000 Huawei Ascend 910C-Chips.
  • Diese Enthüllung zeigt, dass chinesische Beschleuniger nun Trainingslasten auf einheimischer Siliziumbasis bewältigen können – jenen Teil der KI-Pipeline, bei dem chinesische Unternehmen unter den US-Exportkontrollen am meisten Schwierigkeiten hatten, sich lösen.

SvyTech-Check

Redaktionelle Einordnung

Eigene Kontextschicht

Kernpunkt

Huawei führte die Arbeit gemeinsam mit dem Shenzhen Loop Area Institute, dem Shenzhen-Campus des Harbin Institute of Technology und dem Shenzhen Research Institute of Big Data durch.

Warum relevant

Der Ascend 910C ist Huaweis aktueller Flaggschiff-AI-Beschleuniger, ein Dual-Die-Chip, der in früheren DeepSeek-Tests etwa 60 % der Inferenzleistung einer Nvidia H100 erreichte.

Einordnung

SvyTech ordnet die Meldung aus Tom's Hardware als Teil des Themenfelds Technologie ein und verweist auf den Originalartikel, damit Leser Fakten, Quelle und Kontext nachvollziehen koennen.

Huawei führte die Arbeit gemeinsam mit dem Shenzhen Loop Area Institute, dem Shenzhen-Campus des Harbin Institute of Technology und dem Shenzhen Research Institute of Big Data durch. Der Ascend 910C ist Huaweis aktueller Flaggschiff-AI-Beschleuniger, ein Dual-Die-Chip, der in früheren DeepSeek-Tests etwa 60 % der Inferenzleistung einer Nvidia H100 erreichte.

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben
Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Chinesische Chips sind bei der Inferenz wettbewerbsfähig, bei der ein fertiges Modell auf Abfragen antwortet, jedoch bei dem Training schwach, bei dem die Gewichte eines Modells über große Datensätze hinweg neu berechnet werden.

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben
Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Das Team gab an, dass es ein vollständiges Post-Training mit allen Parametern durchführte, was bedeutet, dass jedes Gewicht aktualisiert wurde, statt lediglich eine dünne Adapter-Schicht hinzuzufügen. Post-Training entspricht im Wesentlichen der „Feinabstimmung"-Phase, die auf der deutlich umfangreicheren Pre-Training-Phase folgt.

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben
Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Beim Pre-Training werden die Kernfähigkeiten eines Modells entwickelt, indem es riesige Textkorpora durchläuft; laut der Dokumentation von V4-Pro mehr als 32 Billionen Token. Photonik und Hochgeschwindigkeitsdatenübertragung sind der nächste große Engpass für KI. Der aktuelle Stand der Kühlsysteme in Rechenzentren.

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben
Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Massive Bauvorhaben für KI-Rechenzentren belasten die Energieversorgung. Ultra Ethernet: Die zukünftige Vernetzung wird das Verhalten durch Befolgung, Sicherheitsausrichtung und datenspezifische Informationen geformt.

Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben
Huawei-Team behauptet, DeepSeek-Modell mit 1,6 Billionen Parametern auf Ascend-910C-Chips nachtrainiert zu haben

Die Fertigstellung auf Ascend-Silizium ist ein echtes Ergebnis für die Plattform, beweist jedoch nicht, dass die Chips ein Frontier-Modell können – eine aufwendigere und kostspieligere Aufgabe.

Quelllink

Originalquelle: Tom's Hardware

Originalartikel oeffnen

Quellenprofil

Quelle und redaktionelle Angaben

Quelle
Tom's Hardware
Originaltitel
Huawei-led team claims it post-trained DeepSeek's 1.6-trillion-parameter model — 1,000 Ascend 910C chips used in training
Canonical
https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-led-team-claims-it-post-trained-deepseeks-1-6-trillion-parameter-models-on-ascend-910c-chips
Quell-URL
https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-led-team-claims-it-post-trained-deepseeks-1-6-trillion-parameter-models-on-ascend-910c-chips

Aehnliche Inhalte

Verwandte Themen und interne Verlinkung

Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.