Η κινεζική startup τεχνητής νοημοσύνης DeepSeek το Σάββατο αποκάλυψε ορισμένα στοιχεία κόστους και εσόδων που σχετίζονται με τα επιτυχημένα μοντέλα V3 και R1, υποστηρίζοντας θεωρητικό λόγο κόστους-κέρδους έως και 545% την ημέρα, αν και προειδοποίησε ότι τα πραγματικά έσοδα θα ήταν σημαντικά χαμηλότερα, αναφέρει το Reuters.
Αυτή είναι η πρώτη φορά που η εταιρεία με έδρα το Hangzhou αποκαλύπτει πληροφορίες σχετικά με τα περιθώρια κέρδους της από λιγότερο υπολογιστικά εντατικές εργασίες «συμπερασμάτων», το στάδιο μετά την εκπαίδευση που περιλαμβάνει εκπαιδευμένα μοντέλα τεχνητής νοημοσύνης που κάνουν προβλέψεις ή εκτελούν εργασίες, όπως μέσω chatbots.
Η αποκάλυψη θα μπορούσε να κλονίσει περαιτέρω τις μετοχές της τεχνητής νοημοσύνης εκτός Κίνας που σημείωσαν βουτιά τον Ιανουάριο μετά την αύξηση της δημοτικότητας των chatbot ιστού και εφαρμογών που τροφοδοτούνται από τα μοντέλα R1 και V3.
Το sell-off προκλήθηκε εν μέρει από τους ισχυρισμούς της DeepSeek ότι ξόδεψε λιγότερα από 6 εκατομμύρια δολάρια για τα τσιπ που χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου, πολύ λιγότερα από όσα ξόδεψαν οι αντίπαλοι των ΗΠΑ όπως το OpenAI.
Αμφισβήτηση
Τα τσιπ που χρησιμοποίησε η DeepSeek, το H800 της Nvidia, είναι επίσης πολύ λιγότερο ισχυρά από αυτά στα οποία έχουν πρόσβαση η OpenAI και άλλες εταιρείες τεχνητής νοημοσύνης των ΗΠΑ, κάνοντας τους επενδυτές να αμφισβητούν ακόμη περισσότερο τις δεσμεύσεις των αμερικανικών εταιρειών τεχνητής νοημοσύνης να ξοδέψουν δισεκατομμύρια δολάρια σε τσιπ αιχμής.
Η DeepSeek είπε σε μια ανάρτηση στο GitHub που δημοσιεύθηκε το Σάββατο ότι αν υποτεθεί ότι το κόστος ενοικίασης ενός τσιπ H800 είναι 2 $ ανά ώρα, το συνολικό ημερήσιο κόστος συμπερασμάτων για τα μοντέλα V3 και R1 είναι 87.072 $. Αντίθετα, τα θεωρητικά ημερήσια έσοδα που παράγονται από αυτά τα μοντέλα είναι 562.027 $, οδηγώντας σε αναλογία κόστους-κέρδους 545%. Σε ένα χρόνο αυτό θα ανερχόταν σε μόλις περισσότερα από 200 εκατομμύρια δολάρια σε έσοδα.
Ωστόσο, η εταιρεία πρόσθεσε ότι τα “πραγματικά έσοδά της είναι σημαντικά χαμηλότερα” επειδή το κόστος χρήσης του μοντέλου V3 είναι χαμηλότερο από το μοντέλο R1, μόνο ορισμένες υπηρεσίες δημιουργούν έσοδα καθώς η πρόσβαση στον ιστό και τις εφαρμογές παραμένει δωρεάν και οι προγραμματιστές πληρώνουν λιγότερα σε ώρες εκτός αιχμής.
Πηγή: ot.gr