Γλώσσες Προγραμματισμού
Χρειάζεστε πραγματικά όλες αυτές τις GPUs;
Οι επιχειρήσεις ανακαλύπτουν ότι δεν χρειάζονται ακριβές GPUs για την επιτυχία στην AI, εστιάζοντας σε πρακτικές λύσεις και οικονομική αποδοτικότητα.
Τα τελευταία χρόνια, η αφήγηση γύρω από την τεχνητή νοημοσύνη (AI) έχει επικεντρωθεί στις GPUs (μονάδες επεξεργασίας γραφικών) και την υπολογιστική τους δύναμη. Οι εταιρείες έχουν αποδεχθεί την ιδέα ότι οι ακριβές, υπερσύγχρονες GPUs είναι απαραίτητες για την εκπαίδευση και λειτουργία των μοντέλων AI. Οι πάροχοι δημόσιου νέφους και οι κατασκευαστές υλικού προώθησαν αυτή την πεποίθηση, διαφημίζοντας τα νεότερα, πιο ισχυρά chips ως κρίσιμα για την παραμονή στον ανταγωνισμό στον αγώνα για την καινοτομία στην AI.
Η πραγματική ανάγκη για GPUs
Η έκπληξη; Οι GPUs δεν ήταν ποτέ τόσο κρίσιμες για την επιτυχία της AI στις επιχειρήσεις όσο μας έκαναν να πιστεύουμε. Πολλές από τις εργασίες AI που εξαρτώνται οι επιχειρήσεις σήμερα, όπως οι μηχανές συστάσεων, οι προβλεπτικές αναλύσεις και τα chatbots, δεν απαιτούν πρόσβαση στο πιο προηγμένο υλικό. Παλαιότερες GPUs ή ακόμα και κοινοί επεξεργαστές (CPUs) μπορούν συχνά να καλύψουν τις ανάγκες με σημαντικά χαμηλότερο κόστος.
Καθώς η πίεση για μείωση του κόστους και αύξηση της αποτελεσματικότητας αυξάνεται, οι εταιρείες αμφισβητούν τον θόρυβο γύρω από τις GPUs και βρίσκουν έναν πιο πραγματιστικό δρόμο προς τα εμπρός, αλλάζοντας τον τρόπο προσέγγισης της υποδομής και των επενδύσεων στην AI.
Η δραματική πτώση των τιμών των GPUs
Πρόσφατες αναφορές αποκαλύπτουν ότι οι τιμές των GPUs με υψηλή ζήτηση που παρέχονται από το νέφος έχουν καταρρεύσει. Για παράδειγμα, το κόστος μιας AWS H100 GPU Spot Instance μειώθηκε έως και 88% σε ορισμένες περιοχές, από $105.20 στις αρχές του 2024 σε $12.16 μέχρι το τέλος του 2025. Παρόμοιες μειώσεις τιμών έχουν παρατηρηθεί σε όλους τους μεγάλους παρόχους νέφους.
Αυτή η μείωση μπορεί να φαίνεται θετική. Οι επιχειρήσεις εξοικονομούν χρήματα και οι πάροχοι νέφους προσαρμόζουν την προσφορά. Ωστόσο, υπάρχει μια κρίσιμη αλλαγή στη λήψη επιχειρηματικών αποφάσεων πίσω από αυτούς τους αριθμούς. Οι μειώσεις τιμών δεν προήλθαν από υπερπροσφορά· αντικατοπτρίζουν τις μεταβαλλόμενες προτεραιότητες. Η ζήτηση για GPUs κορυφαίας τεχνολογίας μειώνεται καθώς οι επιχειρήσεις αναρωτιούνται γιατί να πληρώσουν για ακριβές GPUs όταν πιο οικονομικές εναλλακτικές προσφέρουν σχεδόν πανομοιότυπα αποτελέσματα για τις περισσότερες εργασίες AI.
Όχι όλες οι AI απαιτούν κορυφαίες GPUs
Η ιδέα ότι οι μεγαλύτερες και καλύτερες GPUs είναι απαραίτητες για την επιτυχία της AI ήταν πάντα ελαττωματική. Σίγουρα, η εκπαίδευση μεγάλων μοντέλων όπως το GPT-4 ή το MidJourney χρειάζεται πολύ υπολογιστική ισχύ, συμπεριλαμβανομένων των κορυφαίων GPUs ή TPUs. Αλλά αυτές οι περιπτώσεις αντιπροσωπεύουν ένα μικρό ποσοστό των εργασιών AI στον επιχειρηματικό κόσμο. Οι περισσότερες επιχειρήσεις επικεντρώνονται σε εργασίες AI inference που χρησιμοποιούν προεκπαιδευμένα μοντέλα για πραγματικές εφαρμογές: ταξινόμηση emails, παροχή συστάσεων αγορών, ανίχνευση ανωμαλιών και δημιουργία απαντήσεων υποστήριξης πελατών. Αυτές οι εργασίες δεν απαιτούν κορυφαίες GPUs. Στην πραγματικότητα, πολλές εργασίες inference εκτελούνται άψογα σε ελαφρώς παλαιότερες GPUs όπως οι σειρές Nvidia’s A100 ή H100, οι οποίες είναι πλέον διαθέσιμες σε πολύ χαμηλότερο κόστος.
Ακόμα πιο εντυπωσιακό; Ορισμένες εταιρείες διαπιστώνουν ότι δεν χρειάζονται καθόλου GPUs για πολλές AI-related λειτουργίες. Τυπικοί κοινοί CPUs μπορούν να χειριστούν μικρότερα, λιγότερο περίπλοκα μοντέλα χωρίς πρόβλημα. Ένα chatbot για εσωτερικές ερωτήσεις HR ή ένα σύστημα σχεδιασμένο να προβλέπει την κατανάλωση ενέργειας δεν χρειάζεται το ίδιο υλικό με ένα πρωτοποριακό ερευνητικό έργο AI. Πολλές εταιρείες συνειδητοποιούν ότι η προσκόλληση σε ακριβές GPUs αφορά περισσότερο το κύρος παρά την ανάγκη.
Όταν η AI έγινε το επόμενο μεγάλο θέμα, συνοδεύτηκε από εκρηκτικές απαιτήσεις υλικού. Οι εταιρείες έσπευσαν να αποκτήσουν τις τελευταίες GPUs για να παραμείνουν ανταγωνιστικές, και οι πάροχοι νέφους ήταν πρόθυμοι να βοηθήσουν. Το πρόβλημα; Πολλές από αυτές τις αποφάσεις καθοδηγήθηκαν από τον θόρυβο και τον φόβο της απώλειας (FOMO) παρά από σκεπτική σχεδίαση. Ο Laurent Gil, CEO της Cast AI, σημείωσε πώς η συμπεριφορά των πελατών καθοδηγείται από το FOMO όταν αγοράζουν νέες GPUs.
Καθώς οι οικονομικές πιέσεις αυξάνονται, πολλές επιχειρήσεις συνειδητοποιούν ότι υπερπροσφέρουν την υποδομή AI τους για χρόνια. Το ChatGPT χτίστηκε σε παλαιότερες GPUs της Nvidia και απέδωσε αρκετά καλά για να καθορίσει τα πρότυπα AI. Εάν οι μεγάλες καινοτομίες μπορούσαν να επιτύχουν χωρίς το τελευταίο υλικό, γιατί οι επιχειρήσεις να επιμένουν σε αυτό για πολύ απλούστερες εργασίες; Είναι καιρός να επανεκτιμήσουμε τις επιλογές υλικού και να καθορίσουμε αν ευθυγραμμίζονται με τις πραγματικές εργασίες. Όλο και περισσότερο, η απάντηση είναι όχι.
Προσαρμογή των παρόχων δημόσιου νέφους
Αυτή η αλλαγή είναι εμφανής στα αποθέματα των παρόχων νέφους. Οι κορυφαίες GPUs όπως οι επεξεργαστές GB200 Blackwell της Nvidia παραμένουν σε εξαιρετικά περιορισμένη προσφορά, και αυτό δεν πρόκειται να αλλάξει σύντομα. Εν τω μεταξύ, παλαιότερα μοντέλα όπως το A100 παραμένουν αχρησιμοποίητα στα κέντρα δεδομένων καθώς οι εταιρείες απομακρύνονται από την αγορά του επόμενου μεγάλου πράγματος.
Πολλοί πάροχοι πιθανότατα υπερεκτίμησαν τη ζήτηση, υποθέτοντας ότι οι επιχειρήσεις θα ήθελαν πάντα νεότερα, ταχύτερα chips. Στην πραγματικότητα, οι εταιρείες τώρα επικεντρώνονται περισσότερο στην οικονομική αποδοτικότητα παρά στην καινοτομία. Η τιμολόγηση Spot έχει επιδεινώσει περαιτέρω αυτές τις δυναμικές της αγοράς, καθώς οι επιχειρήσεις χρησιμοποιούν αυτοματοποίηση φόρτου εργασίας με AI για να αναζητήσουν τις φθηνότερες διαθέσιμες επιλογές.
Ο Gil εξήγησε επίσης ότι οι επιχειρήσεις που είναι πρόθυμες να μετακινούν δυναμικά τους φόρτους εργασίας μπορούν να εξοικονομήσουν έως και 80% σε σύγκριση με εκείνες που είναι κλειδωμένες σε στατικές συμφωνίες τιμολόγησης. Αυτό το επίπεδο ευελιξίας δεν ήταν εφικτό για πολλές εταιρείες στο παρελθόν, αλλά με την αυξανόμενη διαθεσιμότητα αυτορυθμιζόμενων συστημάτων, γίνεται πλέον το πρότυπο.
Μια παράδειγμα κοινής λογικής
Οι ακριβές, αιχμηρές GPUs μπορεί να παραμείνουν ένα κρίσιμο εργαλείο για την καινοτομία AI στην αιχμή, αλλά για τις περισσότερες επιχειρήσεις, ο δρόμος προς την επιτυχία στην AI είναι στρωμένος με παλαιότερες GPUs ή ακόμα και κοινούς CPUs. Η πτώση των τιμών των GPUs στο νέφος δείχνει ότι περισσότερες εταιρείες συνειδητοποιούν ότι η AI δεν απαιτεί κορυφαίο υλικό για τις περισσότερες εφαρμογές. Η διόρθωση της αγοράς από υπερβολικές, υπερπροσφερόμενες συνθήκες τώρα δίνει έμφαση στην απόδοση επένδυσης (ROI). Αυτή είναι μια υγιής και αναγκαία διόρθωση στην μη βιώσιμη πορεία της βιομηχανίας AI από υπεσχέσεις και υπερπροσφορές.
Αν υπάρχει ένα συμπέρασμα, είναι ότι οι επιχειρήσεις πρέπει να επενδύουν εκεί που έχει σημασία: σε πρακτικές λύσεις που προσφέρουν επιχειρηματική αξία χωρίς να καταστρέφουν τον προϋπολογισμό. Στην ουσία της, η AI δεν ήταν ποτέ για το υλικό. Οι εταιρείες πρέπει να επικεντρωθούν στην παροχή πληροφοριών, στη δημιουργία αποδοτικότητας και στη βελτίωση της λήψης αποφάσεων. Η επιτυχία έγκειται στο πώς οι επιχειρήσεις χρησιμοποιούν την AI, όχι στο υλικό που την υποστηρίζει. Για τις επιχειρήσεις που ελπίζουν να ευδοκιμήσουν στο μέλλον που καθοδηγείται από την AI, είναι καιρός να εγκαταλείψουν τις παρωχημένες υποθέσεις και να αγκαλιάσουν μια πιο έξυπνη προσέγγιση στις επενδύσεις υποδομών.