Στα ενδότερα της NVIDIA Turing αρχιτεκτονικής

Σήμερα 14 Σεπτεμβρίου η NVIDIA δίνει το δικαίωμα σε όλους να αναδημοσιεύσουν πληροφορίες για τη νέα γενιά καρτών γραφικών.

Οι περισσότερες απορίες που ακούμε από τον περίγυρό μας σχετίζονται κυρίως με τις επιδόσεις των καρτών, με τα ποσοστά overclocking που μπορούν να δεχτούν και λιγότερο με τις αρχιτεκτονικές αλλαγές. Σε αυτό το θέμα θα δούμε κυρίως το δεύτερο κομμάτι, τις αλλαγές και τις προσθήκες μέσα από τα επίσημα slides της εταιρίας.

Τα έξτρα execution units που προστίθενται στην Turing δικαιολογούν την αύξηση στο μέγεθος των πυρήνων από την γενιά των Pascal. Αρχικά έχουμε τη προσθήκη σε κάθε Streaming Multiprocessor των 64 CUDA cores, τεσσάρων INT32 μονάδων και έτσι θα μπορεί να τρέχει παράλληλα floating point και non floating point εργασίες αυξάνοντας στη θεωρία τις επιδόσεις μέχρι και 35% σε ορισμένα σενάρια. Δίπλα στο κομμάτι του compute υπάρχουν και οι πυρήνες Tensor και συνολικά υπάρχουν τέσσερις σε κάθε SM ενώ ο SM κλείνει με έναν Ray Tracing πυρήνα ενώ οι L1 cache του κάθε SM διπλασιάζουν το bandwidth τους. Νέες Shading τεχνικές και καλύτερο memory compression θα είναι και αυτά ανάμεσα στα νέα features της νέας γενιάς που θα επιτρέψουν μεγαλύτερο αριθμό αντικειμένων σε κάθε σκηνή ενώ με την shader limiting τεχνική ο developer θα μπορεί να μειώσει τον ρυθμό του shading εάν δεν προσφέρει κάτι στην ποιότητα της εικόνας.

Ένα Streaming Multiprocessor.

Ο TU102 πυρήνας των 4608 CUDA cores.

Tensor Cores

Η NVIDIA για άλλη μια χρονιά αναφέρεται εκτενώς στο overclocking των νέων καρτών. Στην γενιά των RTX θα γίνει ακόμη πιο καλύτερο κυρίως λόγω του ισχυρότερου κυκλώματος τροφοδοσίας των καρτών που είναι και αυτή στη λίστα των σημαντικών διαφορών από κατασκευαστικής άποψης. Πέρα από το επιπλέον headroom σε Watt που ισχυρίζεται η NVIDIA έχουμε πιο σταθερό power delivery στον πυρήνα με λιγότερες αποκλίσεις και αυτόματο overclocking σε MHz ελαφρώς υψηλότερα από την Pascal γενιά. Την ίδια στιγμή βάζοντας δύο axial fans, όπως γίνεται για χρόνια σε πολλές καταναλωτικές GPUs, οι θερμοκρασίες διατηρούνται σε χαμηλά και υγιή επίπεδα επιβραβεύοντας θεωρητικά τους χρήστες με καλύτερα overclocks ακόμη και στις reference κάρτες, που ούτως ή άλλως δείχνουν overbuilt. Οι GDDR6 μνήμες είναι και εδώ ένα από τα βασικά στοιχεία των νέων GPUs. Το bandwidth αυξάνεται στα 14Gbps και το power efficiency αυξάνεται κατά 20% σε σχέση με την GDDR5X γενιά μνημών.

Πέρα από την κατασκευή των καρτών, υπάρχουν άλλα δύο στοιχεία που θα ενδιαφέρουν όσους εν τέλει "ψηθούν" για την αγορά μιας εκ των δύο αρχικά GeForce RTX GPUs της NVIDIA. Το SLI μέσω του NVLink interface θα λειτουργεί μόνο μέχρι δύο κάρτες ενώ στην περίπτωση του TU106 πυρήνα και της RTX 2070 δε θα υπάρχει η δυνατότητα αυτή. Έτσι 3-way και 4-way SLI δε θα υπάρξουν στην γενιά των Turing, παρά μόνο ίσως για benchmarks. Το bandwidth αυτής της σύνδεσης θα είναι 25GB/s και αμφίδρομο ενώ σε ένα dual link σενάριο με μια 2080 Ti το bandwidth τετραπλασιάζεται.

Οι έξοδοι εικόνας που υποστηρίζονται αλλά θα διαφέρουν πιθανόν από κάρτα σε κάρτα θα είναι DisplayPort 1.4a που θα μπορεί να οδηγήσει και 8K αναλύσεις στα 60Hz και μέχρι δύο 8K αναλύσεις συνολικά. Παράλληλα θα υπάρξει και μια USB Type-C σύνδεση οπότε αναμένομε ένα κύκλωμα 5V να ζει κάπου στο PCB των καρτών για την λειτουργία της. Η σύνδεση θα μπορεί και αυτή να μεταφέρει εικόνα στην οθόνη μας.

 

NVIDIA

Βρείτε μας στα Social:  twitter.jpggplus.jpgfb.jpginsta.jpgyt.png

nvidia, architecture, 2018, Turing , reveal, RTX 2080 Ti, revealtember, 2080

conroe

Members
2018-09-16T15:27:26Z

πολυ σημαντικη η παραλληλη επεξεργασια int vs fl αφου θα μπορουν να ξεμπουκωσουν πραξεις της cpu με την καταλληλη βοηθεια  του software φυσικα. πραγματικη επανασταση απο την nvidia. οκ τσιμπησε λιγο της τιμες αλλα αξιζει για τον κοπο και την δουλεια των μηχανικων. απο οτι φαινεται και η 2060 θα εχει τενσορ - rt cores. περιμενουμε να το δουμε και επισημα αυτο ομως γιατι δεν ειναι σιγουρο. ενα αποσπασμα πιο κατω. 

https://www.gamersnexus.net/guides/3364-nvidia-turing-architecture-technical-deep-dive

And to really bring it back for basics, integers in programming can be thought of as pure, whole numbers – no decimal – while floats will have decimal points with varying degrees of precision (FP16, FP32, FP64). An example of a float in a game might be player coordinate location or object positioning, while an example of integer might be object/enemy counting or resource counting (wood/stone/food supply). A lot of integer in games is pushed to CPUs, of course.

asder

Members
2018-09-16T16:24:25Z
57 minutes ago, conroe said:

πολυ σημαντικη η παραλληλη επεξεργασια int vs fl αφου θα μπορουν να ξεμπουκωσουν πραξεις της cpu με την καταλληλη βοηθεια  του software φυσικα. πραγματικη επανασταση απο την nvidia. οκ τσιμπησε λιγο της τιμες αλλα αξιζει για τον κοπο και την δουλεια των μηχανικων. απο οτι φαινεται και η 2060 θα εχει τενσορ - rt cores. περιμενουμε να το δουμε και επισημα αυτο ομως γιατι δεν ειναι σιγουρο. ενα αποσπασμα πιο κατω. 

 https://www.gamersnexus.net/guides/3364-nvidia-turing-architecture-technical-deep-dive

And to really bring it back for basics, integers in programming can be thought of as pure, whole numbers – no decimal – while floats will have decimal points with varying degrees of precision (FP16, FP32, FP64). An example of a float in a game might be player coordinate location or object positioning, while an example of integer might be object/enemy counting or resource counting (wood/stone/food supply). A lot of integer in games is pushed to CPUs, of course.

αν δε είναι για μεγάλα data sets δεν συμφέρει είναι πολύς ο χρόνος για να πάει απο RAM -> CPU -> GPU και τούμπαλιν

η 2060 πτι εχει βγει ειναι για GTX το ονομα οποτε μαλλον δεν θα χει το rt/tensor θα δουμε

conroe

Members
2018-09-16T16:28:20Z
4 minutes ago, asder said:

αν δε είναι για μεγάλα data sets δεν συμφέρει είναι πολύς ο χρόνος για να πάει απο RAM -> CPU -> GPU και τούμπαλιν

 

εχουμε μεγαλα data sets εδω που πρεπει να επεξεργαστουν πολυ γρηγορα. μα δεν θα χρειαζεται να παει, αυτο λεει.

asder

Members
2018-09-16T16:41:08Z
8 minutes ago, conroe said:

 

εχουμε μεγαλα data sets εδω που πρεπει να επεξεργαστουν πολυ γρηγορα. μα δεν θα χρειαζεται να παει, αυτο λεει.

α νόμιζα αναφέρεσαι γενικά, οχι σε παιχνίδια

Διαβάστε περισσότερα στο Φόρουμ...