Την επομένη των Χριστουγέννων, μια μικρή κινεζική νεοσύστατη εταιρεία με την ονομασία DeepSeek παρουσίασε ένα νέο σύστημα τεχνητής νοημοσύνης που θα μπορούσε να φτάσει τις δυνατότητες των chatbots αιχμής από εταιρείες όπως η OpenAI και η Google.
Αυτό από μόνο του θα αποτελούσε ορόσημο. Αλλά η ομάδα πίσω από το σύστημα, που ονομάζεται DeepSeek-V3, περιέγραψε ένα ακόμη μεγαλύτερο βήμα. Σε ένα ερευνητικό έγγραφο που εξηγεί πώς κατασκεύασαν την τεχνολογία, οι μηχανικοί της DeepSeek δήλωσαν ότι χρησιμοποίησαν μόνο ένα κλάσμα των εξαιρετικά εξειδικευμένων τσιπ υπολογιστών στα οποία βασίζονται οι κορυφαίες εταιρείες τεχνητής νοημοσύνης για να εκπαιδεύσουν τα συστήματά τους.
Αυτά τα τσιπ βρίσκονται στο επίκεντρο ενός τεταμένου τεχνολογικού ανταγωνισμού μεταξύ των Ηνωμένων Πολιτειών και της Κίνας. Καθώς η αμερικανική κυβέρνηση προσπαθεί να διατηρήσει το προβάδισμα της χώρας στην παγκόσμια κούρσα της τεχνητής νοημοσύνης, προσπαθεί να περιορίσει τον αριθμό των ισχυρών τσιπ, όπως αυτά που κατασκευάζονται από την εταιρεία Nvidia της Silicon Valley, που μπορούν να πωληθούν στην Κίνα και σε άλλους ανταγωνιστές.
Σύμφωνα με τους Financial Times, οι πέντε μεγαλύτερες τεχνολογικές εταιρείες που επενδύουν στην τεχνητή νοημοσύνη (Nvidia, Alphabet, Amazon, Microsoft και Meta) έχασαν συνολικά σχεδόν 750 δισ. δολάρια από την αξία τους πριν από το άνοιγμα των αγορών τη Δευτέρα (27/1).
Δαπάνησαν δέκα φορές λιγότερα χρήματα από τη Meta
Ωστόσο, οι επιδόσεις του μοντέλου DeepSeek εγείρουν ερωτήματα σχετικά με τις ακούσιες συνέπειες των εμπορικών περιορισμών της αμερικανικής κυβέρνησης. Οι έλεγχοι ανάγκασαν τους ερευνητές στην Κίνα να γίνουν δημιουργικοί με ένα ευρύ φάσμα εργαλείων που είναι ελεύθερα διαθέσιμα στο διαδίκτυο.
Το chatbot DeepSeek απάντησε σε ερωτήσεις, έλυσε λογικά προβλήματα και έγραψε τα δικά του υπολογιστικά προγράμματα τόσο ικανά όσο οτιδήποτε άλλο κυκλοφορεί ήδη στην αγορά, σύμφωνα με τα τεστ αναφοράς που χρησιμοποιούν οι αμερικανικές εταιρείες τεχνητής νοημοσύνης.
Και δημιουργήθηκε φθηνά, αμφισβητώντας την επικρατούσα ιδέα ότι μόνο οι μεγαλύτερες εταιρείες της τεχνολογικής βιομηχανίας – όλες με έδρα τις Ηνωμένες Πολιτείες – μπορούσαν να αντέξουν οικονομικά να κατασκευάσουν τα πιο προηγμένα συστήματα τεχνητής νοημοσύνης. Οι Κινέζοι μηχανικοί δήλωσαν ότι χρειάστηκαν μόνο περίπου 6 εκατομμύρια δολάρια σε ακατέργαστη υπολογιστική ισχύ για να κατασκευάσουν το νέο τους σύστημα. Αυτό είναι περίπου 10 φορές λιγότερο απ’ ό,τι δαπάνησε ο τεχνολογικός γίγαντας Meta για την κατασκευή της τελευταίας τεχνολογίας τεχνητής νοημοσύνης του.
Διαψεύδονται πολλοί ειδικοί και επενδυτές
«Ο αριθμός των εταιρειών που έχουν 6 εκατομμύρια δολάρια για να δαπανήσουν είναι πολύ μεγαλύτερος από τον αριθμό των εταιρειών που έχουν 100 εκατομμύρια δολάρια ή 1 δισεκατομμύριο δολάρια για να δαπανήσουν», δήλωσε ο Chris V. Nicholson, επενδυτής στην εταιρεία επιχειρηματικών κεφαλαίων Page One Ventures, ο οποίος επικεντρώνεται στις τεχνολογίες τεχνητής νοημοσύνης.
Από τότε που η OpenAI πυροδότησε την έκρηξη της τεχνητής νοημοσύνης το 2022 με την κυκλοφορία του ChatGPT, πολλοί ειδικοί και επενδυτές είχαν καταλήξει στο συμπέρασμα ότι καμία εταιρεία δεν θα μπορούσε να ανταγωνιστεί τους ηγέτες της αγοράς χωρίς να δαπανήσει εκατοντάδες εκατομμύρια δολάρια για εξειδικευμένα τσιπ.
Οι κορυφαίες εταιρείες τεχνητής νοημοσύνης. στον κόσμο εκπαιδεύουν τα chatbots τους χρησιμοποιώντας υπερυπολογιστές που χρησιμοποιούν έως και 16.000 τσιπ, αν όχι περισσότερα. Οι μηχανικοί της DeepSeek, από την άλλη πλευρά, δήλωσαν ότι χρειάζονταν μόνο περίπου 2.000 εξειδικευμένα τσιπ υπολογιστών από την Nvidia.
Οι περιορισμοί στα τσιπ στην Κίνα ανάγκασαν τους μηχανικούς του DeepSeek να το «εκπαιδεύσουν πιο αποτελεσματικά, ώστε να μπορεί να παραμείνει ανταγωνιστικό», δήλωσε ο Jeffrey Ding, επίκουρος καθηγητής στο Πανεπιστήμιο George Washington που ειδικεύεται στις αναδυόμενες τεχνολογίες και τις διεθνείς σχέσεις.
«Σαφάρι» για ταλέντα σε κορυφαία πανεπιστήμια
Νωρίτερα αυτό το μήνα, η κυβέρνηση Μπάιντεν εξέδωσε νέους κανόνες που αποσκοπούν στο να εμποδίσουν την Κίνα να αποκτήσει προηγμένα τσιπ τεχνητής νοημοσύνης μέσω άλλων χωρών. Οι κανόνες βασίζονται σε πολλαπλούς γύρους προηγούμενων περιορισμών που εμποδίζουν τις κινεζικές εταιρείες να αγοράζουν ή να κατασκευάζουν πρωτοποριακά τσιπ υπολογιστών. Ο πρόεδρος Τραμπ δεν έχει ακόμη δηλώσει αν θα διατηρήσει τους κανόνες ή θα τους ανακαλέσει.
Η αμερικανική κυβέρνηση έχει προσπαθήσει να κρατήσει τα προηγμένα τσιπ μακριά από τα χέρια κινεζικών εταιρειών λόγω ανησυχιών ότι θα μπορούσαν να χρησιμοποιηθούν για στρατιωτικούς σκοπούς. Σε απάντηση, ορισμένες εταιρείες στην Κίνα έχουν αποθηκεύσει χιλιάδες τσιπ, ενώ άλλες τα προμηθεύτηκαν από μια ακμάζουσα υπόγεια αγορά λαθρεμπόρων.
Η DeepSeek διοικείται από μια εταιρεία ποσοτικής διαπραγμάτευσης μετοχών που ονομάζεται High Flyer. Μέχρι το 2021, είχε διοχετεύσει τα κέρδη της στην απόκτηση χιλιάδων τσιπ της Nvidia, τα οποία χρησιμοποιούσε για την εκπαίδευση των προηγούμενων μοντέλων της. Η εταιρεία, η οποία δεν ανταποκρίθηκε σε αιτήματα σχολιασμού, έχει γίνει γνωστή στην Κίνα για την προσέλκυση ταλέντων φρέσκων από κορυφαία πανεπιστήμια με την υπόσχεση υψηλών μισθών και τη δυνατότητα να παρακολουθούν τα ερευνητικά ερωτήματα που τους κεντρίζουν περισσότερο το ενδιαφέρον.
Εστιάζουν στην έρευνα
Ο Zihan Wang, ένας μηχανικός υπολογιστών που εργάστηκε σε ένα προηγούμενο μοντέλο DeepSeek, δήλωσε ότι η εταιρεία προσλαμβάνει επίσης ανθρώπους χωρίς κανένα υπόβαθρο στην επιστήμη των υπολογιστών για να βοηθήσει την τεχνολογία να κατανοήσει και να είναι σε θέση να παράγει ποίηση και ερωτήσεις άσσου στις διαβόητα δύσκολες κινεζικές εισαγωγικές εξετάσεις κολεγίων.
Η DeepSeek δεν παράγει προϊόντα για τους καταναλωτές, αφήνοντας τους μηχανικούς της να επικεντρωθούν αποκλειστικά στην έρευνα. Αυτό σημαίνει ότι η τεχνολογία της δεν περιορίζεται από την πιο αυστηρή πτυχή των κινεζικών κανονισμών για την τεχνητή νοημοσύνη, οι οποίοι απαιτούν η τεχνολογία που απευθύνεται στους καταναλωτές να συμμορφώνεται με τους κυβερνητικούς ελέγχους των πληροφοριών.
Τον Δεκέμβριο, η OpenAI παρουσίασε ένα νέο σύστημα «συλλογισμού» με την ονομασία o3 που ξεπερνά τις επιδόσεις των υφιστάμενων τεχνολογιών, αν και δεν είναι ακόμη ευρέως διαθέσιμο εκτός της εταιρείας. Αλλά η DeepSeek συνεχίζει να δείχνει ότι δεν βρίσκεται πολύ πίσω. Αυτόν τον μήνα, κυκλοφόρησε ένα δικό της εντυπωσιακό μοντέλο συλλογιστικής.
(Οι New York Times έχουν μηνύσει την OpenAI και τον συνεργάτη της, τη Microsoft, κατηγορώντας τους για παραβίαση πνευματικών δικαιωμάτων ειδησεογραφικού περιεχομένου που σχετίζεται με συστήματα τεχνητής νοημοσύνης. Η OpenAI και η Microsoft έχουν αρνηθεί τους ισχυρισμούς αυτούς).
Μία… παλιά ιδέα
Ένα κρίσιμο μέρος αυτής της ταχέως μεταβαλλόμενης παγκόσμιας αγοράς είναι μια παλιά ιδέα: το λογισμικό ανοικτού κώδικα. Όπως και πολλές άλλες εταιρείες, η DeepSeek έχει ανοίξει το τελευταίο της σύστημα τεχνητής νοημοσύνης, πράγμα που σημαίνει ότι έχει μοιραστεί τον υποκείμενο κώδικα με άλλες επιχειρήσεις και ερευνητές. Αυτό επιτρέπει σε άλλους να κατασκευάσουν και να διανείμουν τα δικά τους προϊόντα χρησιμοποιώντας τις ίδιες τεχνολογίες.
Ενώ οι εργαζόμενοι σε μεγάλες κινεζικές εταιρείες τεχνολογίας περιορίζονται στη συνεργασία με συναδέλφους, «αν εργάζεσαι σε ανοικτό κώδικα, συνεργάζεσαι με ταλέντα από όλο τον κόσμο», δήλωσε ο Yineng Zhang, επικεφαλής μηχανικός λογισμικού στην Baseten στο Σαν Φρανσίσκο, ο οποίος εργάζεται στο έργο ανοικτού κώδικα SGLang. Βοηθάει άλλους ανθρώπους και εταιρείες να δημιουργήσουν προϊόντα χρησιμοποιώντας το σύστημα DeepSeek.
Το οικοσύστημα ανοικτού κώδικα για την τεχνητή νοημοσύνη πήρε φόρα το 2023, όταν η Meta μοιράστηκε ελεύθερα ένα σύστημα τεχνητής νοημοσύνης με την ονομασία LLama. Πολλοί υπέθεσαν ότι αυτή η κοινότητα θα ανθούσε μόνο αν οι εταιρείες όπως η Meta – τεχνολογικοί γίγαντες με τεράστια κέντρα δεδομένων γεμάτα με εξειδικευμένα τσιπ – συνέχιζαν να ανοίγουν τις τεχνολογίες τους. Όμως η DeepSeek και άλλες εταιρείες έδειξαν ότι και αυτές μπορούν να επεκτείνουν τις δυνάμεις των τεχνολογιών ανοιχτού κώδικα».
Το κέντρο βάρους της κοινότητας ανοικτού κώδικα έχει μετακινηθεί προς την Κίνα
Πολλά στελέχη και ειδήμονες έχουν υποστηρίξει ότι οι μεγάλες αμερικανικές εταιρείες δεν θα πρέπει να ανοίγουν τον κώδικα των τεχνολογιών τους, διότι θα μπορούσαν να χρησιμοποιηθούν για τη διάδοση παραπληροφόρησης ή να προκαλέσουν άλλη σοβαρή βλάβη. Ορισμένοι Αμερικανοί νομοθέτες έχουν διερευνήσει το ενδεχόμενο να εμποδίσουν ή να περιορίσουν την πρακτική αυτή.
Άλλοι όμως υποστηρίζουν ότι αν οι ρυθμιστικές αρχές καταπνίξουν την πρόοδο της τεχνολογίας ανοικτού κώδικα στις Ηνωμένες Πολιτείες, η Κίνα θα αποκτήσει σημαντικό πλεονέκτημα. Αν οι καλύτερες τεχνολογίες ανοικτού κώδικα προέρχονται από την Κίνα, υποστηρίζουν, οι Αμερικανοί προγραμματιστές θα κατασκευάσουν τα συστήματά τους πάνω σε αυτές τις τεχνολογίες. Μακροπρόθεσμα, αυτό θα μπορούσε να θέσει την Κίνα στο επίκεντρο της έρευνας και της ανάπτυξης της τεχνητής νοημοσύνης.
«Το κέντρο βάρους της κοινότητας ανοικτού κώδικα έχει μετακινηθεί προς την Κίνα», δήλωσε ο Ion Stoica, καθηγητής πληροφορικής στο Πανεπιστήμιο της Καλιφόρνιας στο Μπέρκλεϊ. «Αυτό θα μπορούσε να αποτελέσει τεράστιο κίνδυνο για τις ΗΠΑ», επειδή επιτρέπει στην Κίνα να επιταχύνει την ανάπτυξη νέων τεχνολογιών.
Λίγες ώρες μετά την ορκωμοσία του, ο πρόεδρος Τραμπ ανακάλεσε εκτελεστικό διάταγμα της κυβέρνησης Μπάιντεν που απειλούσε να περιορίσει τις τεχνολογίες ανοικτού κώδικα.
Ο Dr. Stoica και οι φοιτητές του κατασκεύασαν πρόσφατα ένα σύστημα τεχνητής νοημοσύνης με την ονομασία Sky-T1, το οποίο ανταγωνίζεται τις επιδόσεις του τελευταίου συστήματος του OpenAI, που ονομάζεται OpenAI o1, σε ορισμένες δοκιμές αναφοράς. Χρειάστηκαν μόνο 450 δολάρια σε υπολογιστική ισχύ.
Ακόμα και με μηδαμινούς πόρους κατασκευάζονται ανταγωνιστικά συστήματα
Αυτό το κατάφεραν χτίζοντας πάνω σε δύο τεχνολογίες ανοικτού κώδικα που κυκλοφόρησαν από τον κινεζικό τεχνολογικό γίγαντα Alibaba.
Το σύστημα των 450 δολαρίων δεν είναι τόσο ισχυρό όσο η τεχνολογία του OpenAI ή το νέο σύστημα της DeepSeek. Και οι τεχνικές που χρησιμοποίησαν είναι απίθανο να αποδώσουν συστήματα που θα υπερβαίνουν τις επιδόσεις των κορυφαίων τεχνολογιών. Αλλά το έργο έδειξε ότι ακόμη και επιχειρήσεις με μηδαμινούς πόρους μπορούν να κατασκευάσουν ανταγωνιστικά συστήματα.
Ο Reuven Cohen, σύμβουλος τεχνολογίας στο Τορόντο, χρησιμοποιεί το DeepSeek-V3 από τα τέλη Δεκεμβρίου. Λέει ότι είναι συγκρίσιμο με τα πιο πρόσφατα συστήματα της OpenAI, της Google και της νεοφυούς επιχείρησης Anthropic του Σαν Φρανσίσκο – και πολύ φθηνότερο στη χρήση.
«Το DeepSeek είναι ένας τρόπος για μένα να εξοικονομώ χρήματα», δήλωσε. «Αυτό είναι το είδος της τεχνολογίας που κάποιος σαν εμένα θέλει να χρησιμοποιήσει».