Mastodon
Connect with us

Web Development

Η απόδοση του κώδικα από AI: Απογοητευτικά αποτελέσματα

Η μελέτη της CodeFlash αποκαλύπτει ότι τα μεγάλα γλωσσικά μοντέλα δυσκολεύονται να γράψουν αποδοτικό κώδικα.

Published

on

Η απόδοση του κώδικα από AI: Απογοητευτικά αποτελέσματα

Η αυξανόμενη χρήση του AI στον προγραμματισμό

Ο Saurabh Misra, ιδρυτής και CEO της CodeFlash, παρουσίασε μία μελέτη της εταιρείας σχετικά με την ικανότητα της τεχνητής νοημοσύνης (AI) να δημιουργεί αποδοτικό κώδικα στο συνέδριο Infobip Shift στο Μαϊάμι. Η χρήση της AI για την παραγωγή κώδικα αυξάνεται συνεχώς. Ο Misra ανέφερε ότι η Microsoft χρησιμοποιεί AI για να γράψει το 25% του κώδικά της, ενώ το 30% του κώδικα της Google είναι γραμμένο από AI. Σε ένα τέταρτο των νεοφυών επιχειρήσεων, το 95% του κώδικα γράφεται πλέον εξ ολοκλήρου από AI.

Η πρόκληση της απόδοσης του κώδικα

Η συγγραφή κώδικα είναι ένα πράγμα, αλλά η συγγραφή αποδοτικού κώδικα είναι κάτι εντελώς διαφορετικό. Η εταιρεία, που ειδικεύεται στη βελτιστοποίηση κώδικα Python, αναρωτήθηκε αν ο κώδικας που παράγεται από μεγάλα γλωσσικά μοντέλα (LLMs) είναι αποδοτικός. “Αυτό που βρήκαμε ήταν σοκαριστικό,” δήλωσε ο Misra. “Διαπιστώσαμε ότι τα LLMs δυσκολεύονται να γράψουν αποδοτικό κώδικα.”

Απογοητευτικά αποτελέσματα από τα LLMs

Η εταιρεία βελτιστοποίησε 100.000 λειτουργίες ανοικτού κώδικα και διαπίστωσε ότι το 62% του χρόνου, ο νέος κώδικας που δημιουργήθηκε από AI περιείχε σφάλματα. Όπου ο κώδικας ήταν σωστός, το 28% του χρόνου δεν ήταν αποδοτικός — δηλαδή ήταν πιο αργός ή είχε την ίδια απόδοση με πριν — και μόνο το 10% του χρόνου ο κώδικας ήταν πραγματικά πιο γρήγορος. Αυτό σημαίνει ότι το 90% του χρόνου τα LLMs απέτυχαν να βελτιστοποιήσουν την απόδοση του κώδικα.

Επιπλέον ευρήματα και υποστήριξη από τη βιομηχανία

Η έρευνά τους έδειξε επίσης ότι το 90% των βελτιστοποιήσεων που προτείνονται από κορυφαία LLMs είναι λανθασμένες. Η ανάρτηση στο blog της εταιρείας πρόσθεσε ότι δεδομένα από την Harness.io υποστηρίζουν τα ευρήματα της CodeFlash. Σύμφωνα με την Harness, το 52% των ηγετών μηχανικών και το 54% των προγραμματιστών ανέφεραν ότι η αυξημένη χρήση AI οδηγεί άμεσα σε προβλήματα απόδοσης.

Η δυσκολία συγγραφής αποδοτικού κώδικα

“Η συγγραφή αποδοτικού κώδικα είναι απλώς ένα δύσκολο πρόβλημα,” δήλωσε ο Misra. “Πρέπει να κατανοήσετε πραγματικά τι συμβαίνει σε πολύ βαθύ επίπεδο, να κατανοήσετε τις διαθέσιμες επιλογές, ποιοι αλγόριθμοι και ποιες βιβλιοθήκες μπορεί να είναι διαθέσιμες, και αυτό απαιτεί πολλή βαθιά γνώση.”

Έλεγχος προσβασιμότητας μοντέλων AI

Την Πέμπτη, στην 14η ετήσια Παγκόσμια Ημέρα Ευαισθητοποίησης για την Προσβασιμότητα (GAAD), το ίδρυμα GAAD και η εταιρεία αυτοματοποίησης ροής εργασιών ServiceNow λάνσαραν έναν Έλεγχο Προσβασιμότητας Μοντέλων AI. Ο έλεγχος αξιολογεί και συγκρίνει το πόσο καλά μπορούν τα γλωσσικά μοντέλα να παράγουν προσβάσιμο κώδικα, παρέχοντας ένα σημείο αναφοράς για τις εταιρείες να δοκιμάσουν και να αποδείξουν την προσβασιμότητα των μοντέλων τους.

Νέα ιστοσελίδα Angular με AI-driven αναζήτηση

Αναρωτιέστε αν η έκδοση του Angular που χρησιμοποιείτε υποστηρίζει μια συγκεκριμένη δυνατότητα; Ο προγραμματιστής frontend Gérôme Grignon ανέπτυξε μια ιστοσελίδα που μπορεί να σας βοηθήσει. Το Angular Can I Use ελέγχει τη συμβατότητα δυνατοτήτων μεταξύ εκδόσεων για εσάς. Τεκμηριώνει τι είναι πειραματικό, τι είναι σε προεπισκόπηση για προγραμματιστές, τι είναι σταθερό και όλα όσα έχουν καταργηθεί ή αφαιρεθεί στις εκδόσεις Angular 13-20.

Η υποστήριξη της Microsoft για το React Native

Η Microsoft μοιράστηκε πρόσφατα πώς η ομάδα του Office χρησιμοποίησε το React Native για να βελτιώσει την αξιοπιστία των εφαρμογών και να αναβαθμίσει την εμπειρία ανάπτυξης. Αυτό δεν είναι η πρώτη φορά που η Microsoft ενθαρρύνει τους προγραμματιστές να χρησιμοποιήσουν το πλαίσιο που δημιούργησε η Meta, παρά την επένδυσή της σε C# ή C++. Το React Native μπορεί να ενσωματωθεί σε υπάρχουσες εφαρμογές Windows, επιτρέποντας στις εφαρμογές να επιλέξουν ποιες εμπειρίες να μεταφέρουν στην πλατφόρμα.

Το κορυφαίο AI για ανάπτυξη ιστοσελίδων

Η Google πρόσφατα ανακοίνωσε ότι το Gemini 2.5 Pro είναι το κορυφαίο AI για ανάπτυξη frontend ιστοσελίδων, βασιζόμενη στην επίδοσή του στο WebDev Arena leaderboard. Το Gemini 2.5 Pro πέτυχε σκορ 1420, ξεπερνώντας το Claude 3.7 Sonnet που είχε σκορ 1357. Το WebDev Arena leaderboard μετρά την ανθρώπινη προτίμηση για την ικανότητα ενός μοντέλου να δημιουργεί αισθητικά ευχάριστες και λειτουργικές web εφαρμογές.

Advertisement