MetallicGR

Στα ενδότερα της NVIDIA Turing αρχιτεκτονικής

Recommended Posts

Σήμερα 14 Σεπτεμβρίου η NVIDIA δίνει το δικαίωμα σε όλους να αναδημοσιεύσουν πληροφορίες για τη νέα γενιά καρτών γραφικών.

 

 

Οι περισσότερες απορίες που ακούμε από τον περίγυρό μας σχετίζονται κυρίως με τις επιδόσεις των καρτών, με τα ποσοστά overclocking που μπορούν να δεχτούν και λιγότερο με τις αρχιτεκτονικές αλλαγές. Σε αυτό το θέμα θα δούμε κυρίως το δεύτερο κομμάτι, τις αλλαγές και τις προσθήκες μέσα από τα επίσημα slides της εταιρίας.

 

 

Τα έξτρα execution units που προστίθενται στην Turing δικαιολογούν την αύξηση στο μέγεθος των πυρήνων από την γενιά των Pascal. Αρχικά έχουμε τη προσθήκη σε κάθε Streaming Multiprocessor των 64 CUDA cores, τεσσάρων INT32 μονάδων και έτσι θα μπορεί να τρέχει παράλληλα floating point και non floating point εργασίες αυξάνοντας στη θεωρία τις επιδόσεις μέχρι και 35% σε ορισμένα σενάρια. Δίπλα στο κομμάτι του compute υπάρχουν και οι πυρήνες Tensor και συνολικά υπάρχουν τέσσερις σε κάθε SM ενώ ο SM κλείνει με έναν Ray Tracing πυρήνα ενώ οι L1 cache του κάθε SM διπλασιάζουν το bandwidth τους. Νέες Shading τεχνικές και καλύτερο memory compression θα είναι και αυτά ανάμεσα στα νέα features της νέας γενιάς που θα επιτρέψουν μεγαλύτερο αριθμό αντικειμένων σε κάθε σκηνή ενώ με την shader limiting τεχνική ο developer θα μπορεί να μειώσει τον ρυθμό του shading εάν δεν προσφέρει κάτι στην ποιότητα της εικόνας.

 

Ένα Streaming Multiprocessor.

3-1080.4102150988.jpg.14ba2beb73ab9be837dac78f0bed8475.jpg

 

 

 

Ο TU102 πυρήνας των 4608 CUDA cores.

25-1080.763080166.jpg.057cddeeab34afef8c8b053eb41c57d3.jpg

 

 

image5.jpg.17e4e45e3b5dee14735a475f815fe746.jpg

 

5-1080.1315828862.jpg.e4de28bec623c472a087782d36f3ec6d.jpg

 

 

 

Tensor Cores

 

9-1080.4198696761.jpg.f699dfcd10d3d9b2d1888a05fa52138a.jpg

 

10-1080.2351336719.jpg.3f8e68b77bbd4dcbf985d984f6c29ea9.jpg

 

11-1080.4117628345.jpg.d7b1f2f2fa28f53303cc16d1f0ffe69c.jpg

 

12-1080.527230252.jpg.cab1068d3c0c5033d5578e24e9395636.jpg

 

 

 

 

Η NVIDIA για άλλη μια χρονιά αναφέρεται εκτενώς στο overclocking των νέων καρτών. Στην γενιά των RTX θα γίνει ακόμη πιο καλύτερο κυρίως λόγω του ισχυρότερου κυκλώματος τροφοδοσίας των καρτών που είναι και αυτή στη λίστα των σημαντικών διαφορών από κατασκευαστικής άποψης. Πέρα από το επιπλέον headroom σε Watt που ισχυρίζεται η NVIDIA έχουμε πιο σταθερό power delivery στον πυρήνα με λιγότερες αποκλίσεις ενώ θα προσφέρει και αυτόματο overclocking σε MHz ελαφρώς υψηλότερα από την Pascal γενιά. Την ίδια στιγμή βάζοντας δύο axial fans, όπως γίνεται για χρόνια σε πολλές καταναλωτικές GPUs, οι θερμοκρασίες διατηρούνται σε χαμηλά και υγιή επίπεδα επιβραβεύοντας θεωρητικά τους χρήστες με καλύτερα overclocks ακόμη και στις reference κάρτες, που ούτως ή άλλως δείχνουν overbuilt. Οι GDDR6 μνήμες είναι και εδώ ένα από τα βασικά στοιχεία των νέων GPUs. Το bandwidth αυξάνεται στα 14Gbps και το power efficiency αυξάνεται κατά 20% σε σχέση με την GDDR5X γενιά μνημών.

 

 

8-1080.2551604136.jpg.f57ef6f01a2221a4322aba3f2bdce9b0.jpg

 

image8.jpg.9f07a997102604307d0a5af855bf3808.jpg

 

 

 

Πέρα από την κατασκευή των καρτών, υπάρχουν άλλα δύο στοιχεία που θα ενδιαφέρουν όσους εν τέλει "ψηθούν" για την αγορά μιας εκ των δύο αρχικά GeForce RTX GPUs της NVIDIA. Το SLI μέσω του NVLink interface θα λειτουργεί μόνο μέχρι δύο κάρτες ενώ στην περίπτωση του TU106 πυρήνα και της RTX 2070 δε θα υπάρχει η δυνατότητα αυτή. Έτσι 3-way και 4-way SLI δε θα υπάρξουν στην γενιά των Turing, παρά μόνο ίσως για benchmarks. Το bandwidth αυτής της σύνδεσης θα είναι 25GB/s και αμφίδρομο ενώ σε ένα dual link σενάριο με μια 2080 Ti το bandwidth τετραπλασιάζεται.

 

 

Οι έξοδοι εικόνας που υποστηρίζονται αλλά θα διαφέρουν πιθανόν από κάρτα σε κάρτα θα είναι DisplayPort 1.4a που θα μπορεί να οδηγήσει και 8K αναλύσεις στα 60Hz και μέχρι δύο 8K αναλύσεις συνολικά. Παράλληλα θα υπάρξει και μια USB Type-C σύνδεση οπότε αναμένομε ένα κύκλωμα 5V να ζει κάπου στο PCB των καρτών για την λειτουργία της. Η σύνδεση θα μπορεί και αυτή να μεταφέρει εικόνα στην οθόνη μας.

 

 

23-1080.3990901618.jpg.8184bddb1b945ce2b8c6f2cfe6f94ea8.jpg

 

36-1080.2442897696.jpg.0b10042a48cfcbe1270ef39993c22d98.jpg

 

 

 

 

 

NVIDIA

Βρείτε μας στα Social:  twitter.jpggplus.jpgfb.jpginsta.jpgyt.png

 

 

  • Like 1
Link to comment
Share on other sites

πολυ σημαντικη η παραλληλη επεξεργασια int vs fl αφου θα μπορουν να ξεμπουκωσουν πραξεις της cpu με την καταλληλη βοηθεια  του software φυσικα. πραγματικη επανασταση απο την nvidia. οκ τσιμπησε λιγο της τιμες αλλα αξιζει για τον κοπο και την δουλεια των μηχανικων. απο οτι φαινεται και η 2060 θα εχει τενσορ - rt cores. περιμενουμε να το δουμε και επισημα αυτο ομως γιατι δεν ειναι σιγουρο. ενα αποσπασμα πιο κατω. 

https://www.gamersnexus.net/guides/3364-nvidia-turing-architecture-technical-deep-dive

And to really bring it back for basics, integers in programming can be thought of as pure, whole numbers – no decimal – while floats will have decimal points with varying degrees of precision (FP16, FP32, FP64). An example of a float in a game might be player coordinate location or object positioning, while an example of integer might be object/enemy counting or resource counting (wood/stone/food supply). A lot of integer in games is pushed to CPUs, of course.

Link to comment
Share on other sites

57 minutes ago, conroe said:

πολυ σημαντικη η παραλληλη επεξεργασια int vs fl αφου θα μπορουν να ξεμπουκωσουν πραξεις της cpu με την καταλληλη βοηθεια  του software φυσικα. πραγματικη επανασταση απο την nvidia. οκ τσιμπησε λιγο της τιμες αλλα αξιζει για τον κοπο και την δουλεια των μηχανικων. απο οτι φαινεται και η 2060 θα εχει τενσορ - rt cores. περιμενουμε να το δουμε και επισημα αυτο ομως γιατι δεν ειναι σιγουρο. ενα αποσπασμα πιο κατω. 

 https://www.gamersnexus.net/guides/3364-nvidia-turing-architecture-technical-deep-dive

And to really bring it back for basics, integers in programming can be thought of as pure, whole numbers – no decimal – while floats will have decimal points with varying degrees of precision (FP16, FP32, FP64). An example of a float in a game might be player coordinate location or object positioning, while an example of integer might be object/enemy counting or resource counting (wood/stone/food supply). A lot of integer in games is pushed to CPUs, of course.

αν δε είναι για μεγάλα data sets δεν συμφέρει είναι πολύς ο χρόνος για να πάει απο RAM -> CPU -> GPU και τούμπαλιν

η 2060 πτι εχει βγει ειναι για GTX το ονομα οποτε μαλλον δεν θα χει το rt/tensor θα δουμε

Edited by asder
Link to comment
Share on other sites

4 minutes ago, asder said:

αν δε είναι για μεγάλα data sets δεν συμφέρει είναι πολύς ο χρόνος για να πάει απο RAM -> CPU -> GPU και τούμπαλιν

 

εχουμε μεγαλα data sets εδω που πρεπει να επεξεργαστουν πολυ γρηγορα. μα δεν θα χρειαζεται να παει, αυτο λεει.

Edited by conroe
Link to comment
Share on other sites

8 minutes ago, conroe said:

 

εχουμε μεγαλα data sets εδω που πρεπει να επεξεργαστουν πολυ γρηγορα. μα δεν θα χρειαζεται να παει, αυτο λεει.

α νόμιζα αναφέρεσαι γενικά, οχι σε παιχνίδια

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now