Forums Casio - Projets de programmation

Index du Forum > Projets de programmation > Windmill : moteur graphique 3D
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Posté le 30/09/2016 00:44

Windmill : moteur graphique 3D :

Windmill



Bonjour, bonsoir !

Windmill est un moteur graphique 3D pour calculatrices CASIO monochromes.
Ce topic est le journal de bord du projet, il décrit l'avancée étape par étape, jour par jour, depuis la création du projet à aujourd'hui.

Début du projet : juillet 2016
Dernière mise à jour : septembre 2018
Dernière démo : jour 17

Un petit brief d'abord :
Windmill est un moteur graphique 3D, il est capable d'afficher des objets définis en trois dimensions.
Le principe de base du moteur graphique est de décomposer en triangles un modèle 3D puis d'appliquer des textures sur ces triangles en gérant l'occlusion.
Sur calculatrice, il n'existe aucune libairie dédiée à le 3D, donc Windmill a été écrit à partir d'une feuille blanche, tout à été réalisé de A à Z.

Jour 1
Cliquez pour recouvrir

Dans la vidéo, j'ai optimisé le moteur graphique pour les murs verticaux. c'est à dire qu'il ne dessine plus des triangles mais des trapèzes, j'ai commencé l'optimisation pour les murs horizontaux récemment.
La bonne nouvelle c'est qu'il reste une grosse marge de progression pour optimiser ces cas particuliers : éviter les flottants, gérer un peu mieux le clipping, le back face culling et éviter un calcul redondant dans la boucle principale.


Jour 2
Cliquez pour recouvrir

Principalement un gros travail sur l'optimisation des murs : la plupart des calculs flottants sont désormais avec des entiers, le clipping est géré (on affiche pas les pixels en dehors de l'écran), des calculs sont simplifiés, et même pour gagner encore quelques fps les textures doivent être tournées de 90°.
Désormais les murs horizontaux peuvent être affichés, et même le plafond noir (avant c'était de la triche juste pour la vidéo...), des textures peuvent être appliquées sur le sol, et on peux construire des objets telle que la caisse ici présente.
Les textures peuvent être changées pendant le jeu, ainsi cela permettra d'afficher des textures animées comme de l'eau par exemple !
Il y a trois types d'objets affichable :
- les murs. De face ou de coté.
- les étages. Il s'agit d'objets plats, par exemple le sol, le paillasson, le haut de la caisse.
- le plafond. C'est un étage optimisé pour le noir.
Tous les objets sont paramètrables, de la taille, la hauteur, la texture que l'on veut.


Jour 3
Cliquez pour recouvrir

Simplement un aperçu de la vue de coté, en fil de fer cette fois parce que je n'ai pas terminé l'algo pour afficher les textures sur les murs.
J'ai déjà la structure de l'algo pour appliquer mes textures, il me reste plus qu'a l'implémenter. Il ressemble à celui que j'ai déjà mais avec une variante. Cependant je vais le reprendre de zéro pour être certain d'optimiser au mieux.
Parce que avec cette vue il y a beaucoup de chose qui changent :
- les textures appliquées sur le sol, au plafond ne sont plus des sprites classiques, elles sont maintenant déformées ce qui implique d'utiliser l'algo "lourd" et pas un simple affichage de sprite zoomé (cf la lib ML_zoom)
- les murs orientés vers le "sud" ne sont plus visible car toujours vu par "derrière" donc plus besoin d'être géré. Ça c'est une bonne nouvelle, mais je ne pense pas que ça puisse compenser le point du dessus.

Donc en conclusion, j'ai peur quand aux performances de l'ensemble fini. Il va arriver un moment où ça risque de coincer.


Jour 4
Cliquez pour recouvrir

GROSSE GROSSE nouveauté ! Comme promis le moteur gère la vue de coté !!
Pour cela j'ai totalement repris mon algo de base pour appliquer les textures sur des triangles avec un bon passage à la moulinette de l'optimisation, et j'ai ainsi multiplié par 11 les performances ! C'est énorme !

La prochaine étape est d'implémenter le Z-buffer pour ne pas voir à travers les murs, et encore un tas d'optimisations...
Et maintenant il n'y a pas de cas particuliers dans l'algo, c'est à dire que je peux tourner la caméra dans tous les sens, afficher des formes dans n'importe quelle position (mais ça ce sera pour une prochaine vidéo )


Jour 5
Cliquez pour recouvrir
Et voilà encore du nouveau ! (Oui ça avance vite )
Maintenant j'ai rajouté le z_buffer qui permet de ne pas afficher les murs sensé ne pas être visible.
Et j'ai rajouté un degré de liberté pour la caméra, ce qui permet de tourner sur soi-même.
Il reste encore un tas de choses à améliorer (meilleur rendu des textures, déplacement de la caméra selon différents repères) et d'optimisations (accès à la vram plus intelligent pour éviter de dessiner du banc si c'était déjà blanc, passage des calculs pour les rotations, les projections et les produits vectoriels en nombres entiers).
Je vais mixer un peu le rendu avec le mode fil de fer pour les murs vu par derrière (qui sont transparents actuellement). J'ai déjà fait quelques test et on se rend mieux compte des volumes !


Jour 6
Cliquez pour recouvrir
J'ai amélioré la qualité du rendu général en jouant sur les décalages de bits de façon plus astucieuse, en simplifiant des opérations et en arrondissant les nombres flottants. Résultat moins de perte à cause d'arrondi et de troncature, les textures sont moins déformées et plus précises.
J'ai encore optimisé mon algorithme pour appliquer les textures, j'étais passé à côté de quelque chose d'énorme, résultat j'ai pu simplifier encore mes calculs pour gagner 35% de performances. Je suis passé de 10 décalages de bit, 17 mults, 9 additions à 7 décalages, 12 mults et 10 additions.

J'ai apporté quelques modifications au z-buffer (qui permet de ne pas afficher les objets caché par d'autres), l'initialisation est plus rapide et il est plus stable car il ne risque pas de d'overflow. Et je ne dessine plus de pixel blanc si c'est la première fois que je dessine sur un pixel puisqu'il était forcement blanc avant.

J'ai rajouté la gestion des viewport, c'est à dire que le rendu peu être dans une fenêtre définie par le programmeur et plus forcement sur l'écran entier. C'est utile si on utilise un ATH qui prend une partie de l'écran ou dans un menu pour afficher un objet 3D dans un coin facilement. Je n'ai pas testé, mais il est théoriquement possible d'afficher deux rendus différents en même temps, un écran splitté pour le multijoueur par exemple


Jour 7
Cliquez pour recouvrir
Il n'y a pas grand chose de nouveau visuellement donc je sors pas de vidéo, mais maintenant que j'ai fini d'opimisé le rendu des textures, j'ai optimisé la transformation des points dans l'espace 3D. J'ai gagné 71% de rapidité depuis le jour 6 ! Entre autres, j'ai précalculé les cos et sin, les coefficients de la matrice de rotation, le tout avec des nombre entiers.
Ce qui me prend du temps en ce moment c'est la structure de mes données, comment faire quelque chose d'efficace et qui permette d'écrire les modèle 3D rapidement à la main. Donc je gère des mini structures toutes faites, des triangles, des rectangles, et peut être d'autres plus tard comme des cylindres.

De plus, j'ai ajouté une fonctionalité qui permet d'appliquer une texture des deux cotés d'un triangles. Mais un problème est apparu, quand deux textures sont trop prochent l'une de l'autre, elle on tendance à se chevaucher, c'est à dire que la texture qui est derrière est affichée par dessus celle de devant...Ici on voit la texture blanche qui passe par dessus le mur de brique (frame 2 à 7)

Ça fait une journée que je cherche le problème. Il vient evidemment du z-buffer, mais la raison du problème est assez floue


Jour 8
Cliquez pour recouvrir
J'ai réussi à repérer l'origine de mon problème après plusieurs longues séances de documentation et de débeugage.
L'utilisation des matrices de projection perspective m'a permis de remapper la coordonnée z de mes points dans l'espace caméra, c'est à dire que maintenant leur coordonnée z à une valeur logique : elle est définie à 0 quand le point est sur le near clipping plane et à 1 sur le far clipping plane. Deux plans que je définie moi même.

Ceci m'a permis de mettre au jour une relation très vicieuse entre mes triangles que je n'avais pas remarqué jusqu'à présent. Je m'explique : dans ma phase de simplification, j'ai remarqué qu'une division était inutile puisque qu'elle se simplifiait dans une multiplication un peu plus loin. Dans le même genre que (A / B) x (C x B) = A x C
Cela n'a pas posé de problème de simplifier, j'ai obtenu exactement le même rendu.
Cependant, et c'est là que c'est vicieux, c'est que, plus tard, en rajoutant mon z-buffer (qui permet de connaître la distance entre mon point et la caméra afin d'afficher uniquement le plus proche), j'ai fabriqué une relation cachée entre mes triangles. En effet ils ne sont plus dessinés independamment puisqu'ils partagent le même z-buffer.
Et comme j'ai utilisé uniquement A et pas A / B et que B varie d'un triangle à l'autre, les données que je rentrais dans mon z-buffer étaient faussent.
Mais comme B varie peu, le problème ne s'est pas montré au premier abort, mais il était bien là !

Maintenant que je comprends l'origine du problème, je vais pouvoir le résoudre. En tout cas, c'était bien tordu et ça m'a bien pris la tête.
Désolé pour ce passage assez technique, mais expliquer l'origine du problème ne peut pas se faire sans


Jour 9
Cliquez pour recouvrir

Et voilà problème réglé ! Enfin, ça m'a pris une journée complète. (j'ai bien perdu 1h sur un copier coller raté et 3h parce que j'avais pas mon café...)
Maintenant le z-buffer est ultra propre ! je maitrise vraiment tout se qui passe. Un bon point pour la stabilité et éviter l'apparition d'artéfactes visuels


Jour 10
Cliquez pour recouvrir

J'ai commencé à modéliser des vrais objets pour voir ce que mon moteur a dans le ventre, et le résultat est renversant !
En définissant toutes les faces du moulin à vent, j'ai pu créer avec une relative simplicité un résultat plus que correct.
D'un point de vue technique, j'ai de nouveau optimisé depuis le jour précédent, en effet j'avais tout "désoptimisé" pour résoudre mon problème. Les fps en temps réel sont affichés dans le coin de l'écran, on voit que pour un modèle aussi riche (30 triangles) la vitesse du rendu est plus que convenable ce qui démontre que ce projet est viable. De plus il me reste quelques points à optimiser, sur le calcul des coordonnées de textures je peux grater pas mal, j'ai deux divisions que je peux transformer en une seule, et quelques autres idées. Donc j'ai encore de la marge, l'objectif étant qu'a terme le rendu soit le plus véloce possible

Sinon on peut remarquer que j'applique des textures sur des triangles dans des positions quelconques (le toit et les pales) et que j'ai ajouté l'option pour afficher une texture différentes de chaque côté d'un triangle (le toit vu par en dessous est noir) et j'ai rajouté un paramètre pour une bonne utilisation des textures sur les triangles (en effet le sprite est un carré à la base).

La prochaine étape est une réorganisation du code, j'ai deux fichiers que je vais réunir en un seul et je vais revoir comment le moteur recoit les objets à afficher. Dans la prochaine vidéo, les pales du moulin tourneront (enfin je l'espère bien )


Jour 11
Cliquer pour enrouler
Jour 11


Maintenant le moteur peut afficher plusieurs objets différents et les objets dynamiques ! J'ai revu totalement la façon de fournir les objets à afficher au moteur. Maintenant on peut afficher plusieurs objets simultanément, et on peut définir des mouvements pour les objets.


Jour 12
Cliquer pour enrouler
Jour 12

Après une grande pause, le projet reprend, en fonction de ma disponibilté, plus faible qu'avant, mais toujours présente
Comme je l'avais annoncé, la reprise de mes travaux portent sur l'optimisation, la résolution de bugs, et des changements internes pour les nouveautés à venir.

- nettoyage du fov, la valeur qui correspond à l'angle de vision, c'était un peu au pif avant.

- mise en const des variables de la map : les textures, les objets, les triangles et les rectangles.

- j'ai clarifié la précision des fixed (des nombres entiers utilisés comme des nombres à virgules) pour éviter les débordements, c'est surtout problématique pour les objets lointains, ou très proches car des variables s'approchent des limites d'un int.
Maintenant je suis certain qu'afficher un objet à la taille minimale (de taille 1) ne pose aucuns problèmes.
un cube de côté 1 :


un cube de coté 10, avec à sa droite le cube de coté 1.


(On voit le sol à partir de cette échelle, la distance entre les points est de 10)
L'histoire d'échelle est d'ailleurs très subjective, à combien correspond une taille de 10 si on veut la comparer au monde réel ? J'ai fait la proposition suivante : 1 = 10cm

- j'ai ajouté un repère 3D dans un coin de l'écran, c'est utile pour le debug.

- j'ai sorti la camera de la scène, c'est à dire que j'ai crée une classe juste pour la caméra.

- correction d'un problème dans le z-buffer (un tableau de la taille de l'écran enregistrant la distance des pixels par rapport à l'écran), j'avais un overflow, maintenant c'est tout propre !

- nettoyage divers dans le code


Jour 13
Cliquer pour enrouler
Jour 13

J'avance lentement, j'ai assez peu de disponibilité depuis 2 semaines...
MAIS ! Windmill avec encore et toujours
J'ai ajouté une fonctionnalité qui manquait depuis un long moment mais qui est pourtant essentielle : l'affichage des triangles devant le plan de clipping...
Explication :
Je parlais plus haut des plans de clipping, le proche et le lointain. Ces deux plans parralèles forment une pyramide avec à son sommet la caméra. Tout ce qui est entre ces plans est affiché. Le problème c'est si un point du triangle est avant le plan proche, jusqu'à présent si un des points avaient une coordonnée en z négative je n'affichais tout simplement pas le triangle.
Pour résoudre celà je tronque ou divise, en fonction des cas (1 ou 2 points devant le plan)

Desormais il n'y a presque plus de cas où des triangles disparaissent


Jour 14
Cliquer pour enrouler
Jour 14

Le problème de clipping que j'exposais en jour 13 est résolu !
Voici un petit rendu que comment c'était avant et comment c'est maintenant, le triangle (qui est la brique essentielle de tout le reste) est maintenant affichable avec beaucoup plus d'angle. Même quand on est presque dans le mur, il s'affiche correctement.
La texture se déforme légèrement quand on est vraiment proche, c'est dû aux erreurs d'arrondi.
Bonne vidéo


Jour 15
Cliquer pour enrouler
Jour 15

Une grosse surprise se prépare. Encore quelques soucis en train d'être corrigés et vous allez en prendre plein les yeux promis
En attendant cette semaine j'ai corrigé quelques bêtes erreurs comme un 1204 au lieu d'un 1024.
Changé un tas de chose en interne pour homogénéiser mon code
Les ajouts depuis le jour 13 :

Ajouté une ligne d'horizon (c'est tout bête mais ça rend bien mieux)

Changé les coordonnées des textures, maintenant on définit la taille en pixel en la texture, et la taille dans le monde.
Par exemple un texture de 32x32 peut correspondre à un carré de taille 20x20 (soit 2m carré), ou plus, ou moins c'est au choix.
- En affichant cette texture sur un rectangle de taille 40x40, la texture va automatiquement boucler.
- En renseignant 0x0 en taille réelle, la texture va s'étirer sur son support au lieu de boucler.
C'est très pratique pour répéter des motifs sans avoir à créer un autre rectangle, ou alors pour appliquer une texture sur n'importe quelle surface.

Actuellement j'ai un problème de serpent qui se mort la queue, clipping() doit être executé avant afficher() et afficher() doit être executé avant clipping() sinon j'ai des triangles qui s'effacent à certains moment. Je suis en train de corriger ça, mais c'est un peu casse tête

j'ai une grosse piste d'optimisation, si ça fonctionne j'estime à +30% de fps !



Jour 16

Désolé si tu es venu sur ce topic en pensant que j'ai enfin lancé LA démo ultime que j'ai vendu au jour 15.
Aujourd'hui c'est résolution de bugs.
J'ai résolu le problème du serpent qui se mort la queue en créant une fonction dédié plus rapide. Le problème était de savoir quelle face du triangle afficher, pour rentrer les dimensions de la textures dans les points.

Le problème que j'ai maintenant est une erreur d'overflow, lorsque la surface du triangle à afficher est trop importante, les nombres prennent des valeurs qui dépassent les limites d'un int (+- 2 milliards) et provoquent des bugs terribles sur l'affichage des textures.

J'ai bien ciblé le problème, je sais exactement quand, comment et pourquoi il se produit, je ne sais juste pas comment le résoudre simplement.
Après 3 soirées gachées à essayer de bricoler un truc, j'ai décidé de faire une autre fonction de clipping.
Cette fois l'objectif n'est pas découpe en plusieurs triangles ceux qui passent derrière la caméra (comme au jour14), mais découper pour n'avoir que les pixel qui sont à l'écran.
Le petit triangle s'affiche sans procblème, le grand à une aire qui overflow et bug visuellement



Jour 17


Le problème de clipping est résolu !
Pour récapituler, j'ai intégré du clipping sur l'axe devant-derrière pour couper les triangles passant derrière la caméra. Puis j'ai créé une nouvelle fonction pour découper les triangles sur l'axe haut-bas/droite-gauche, c'est à dire les bord de l'écran pour régler des problèmes d'overflow (cf jour 16). Le résultat est que le moteur est capable d'afficher des triangles dans n'importe quelle position, même la plus tordue sans bug, ou déformation du triangle.

A cette occasion j'ai revu toute la structure interne pour gérer l'affichage des objets. Je commence avec 1 triangle, et le clipping peux me renvoyer 1 à 10 triangles. Au lieu de gérer chaque point individuellement et avec des conditions à n'en plus finir, j'ai tout inséré dans un tableau que j'envoie à mes fonctions, et tout roule tout seul. c'est beaucoup plus léger et propre.

J'ai rajouté une synchronisation de la caméra avec le rendu. Le déplacement de la caméra (gestion du clavier) est appelé par un timer à interval régulier, ce qui peut tomber pendant le rendu d'une frame. Du coup je commence à dessiner un objet en regardant sous un angle X, la caméra se mets à jour et je termine de dessiner l'objet sous un angle Y. Ça provoquait des secousses et bugs visuels.

Résolution d'un bug sur le z-buffer.

Correction des quelques soucis avec le rendu du sol.

Un peu d'optimisation sur quelques variables.

Le moteur est super stable et il n'y a plus d'artéfactes visuels majeurs !!
C'est un vrai plaisir à regarder Pour ça rien de mieux qu'une vidéo !
Je teste ici sur émulateur et sur la machine, c'est quand même suffisament fluide, environ 10 fps, sachant que cette valeur est doublée avec de l'overcloacking



Jour 18


Windmill avance toujours, bien que la dernière vidéo soit impressionnante, il reste beaucoup de choses à faire.
Voici les nouveautés de la semaine :
- Réorganisation du code. J'ai ajouté une class Player et une class Engine avec un tas de petites modifications. Maintenant on peut créer son propre moteur physique et de gestion du jeu totalement indépendant du rendu 3D.
On peut même créer des moteurs physiques différents. Je suis en train d'en coder 2 :
>> Moteur de déplacement d'un personnage. En vue classique style FPS, on peut courrir, sauter, regarder dans toutes les direction (@Lephé : tout est fluide), interagir avec les objets (porte, trappe, ...)
>> Moteur de création de map. En vue de haut uniquement, on peut selectionner un objet, le déplacer, le tourner et observer ses coordonnées en temps réel. Une fois au bon endroit, il suffit d'écrire les coordonnées en dur dans le code. Très pratique pour créer une map.

- Ajout des billboard. Ce sont des sprites qui font toujours face au joueur. Il tournent sur l'axe vertical pour toujours faire face à la caméra. J'ai crée des arbres avec et des personnages avec.

- Ajout des masques alpha. Chaque texture doit avoir un sprite, et peut avoir un masque. La texture est dessinée que si le pixel du masque est noir.

- Ajout des sphere englobantes. Au chargement d'une nouvelle map, Windmill calcule automatiquement une sphere englobante pour chaque objet. Ceci permet de faire un test rapide. Si la sphere n'est pas à l'écran, aucune utilisté de vérifier si tous les triangles à l'intérieur sont à l'écran. Pour l'instant j'ai fais l'algo pour créer le spheres, il me reste l'algo pour savoir si elles sont à l'écran. J'ai mesuré les fps avant pour faire la comparaison.

- Ajout d'un tas de petites modifications.

- J'ai commencé à rédiger un manuel complet pour utiliser Windmill

Donc voilà, pas mal de nouveautés, c'est à chaque fois de plus en plus impressionnant


Jour 19


Le jour 19 arrive rapidement après le jour 18 car il y a une bonne nouveauté qui fera sans aucun doute plaisir à entendre !
J'ai terminé l'algo des sphères englobantes pour ne pas "chercher" à afficher les objets qui ne sont pas à l'écran.
Une petite explication plus détaillée
Lors du chargement de la map, un premier algorithme génère pour chaque objet une sphère qui englobe tous ses points. Lors du rendu, un second algorithme test pour chaque objet, si sa sphère est intersecte ou est incluse dans le champ de vision de la caméra. Si c'est le cas, on dessine l'objet, dans le cas contraire l'objet est ignoré.

Soit N le nombre de point d'un objet composant un objet, au lieu de calculer à chaque fois N points, on calcule au pire N+1 (N+centre de la sphère) ou au mieux 1 point. C'est très rentable !
Voici une animation représentant 2 sphères. La rouge est hors du champs de vision, la verte est dans le champs de vision.
Le gain en fps est d'autant plus important que le nombre d'objet hors du champs de vision est important. Donc impossible d'exprimer un gain fixe en fps.
Voici un comparatif :
Cas n°1, la map est peu chargée (celle en exterieur)
                                          avant   après
Tous les objets hors du champs de vision :  67       85
La moitié des objets dans le champs :       28       32

Cas n°1, la map est fort chargée (j'ai ajouté 15 moulins sur la map)
                                          avant   après
Tous les objets hors du champs de vision :  35       83
La moitié des objets dans le champs :       22       32

On remarque qu'avec cette méthode, les objets hors ne baisse pas (ou très peu) les performances.
En plus de cela, ça m'ouvre des opportunités pour de nouvelles foncionnalités


Jour 20

Une petite nouveauté dont je parlais précédemment : le trie des objets en fonction de la distance à la caméra.
Windmill trie en continue les objets pour afficher ceux qui sont les plus près en premier. En vérité Il trie les sphères englobantes.

Par exemple, j'ai placé 7 "murs" les uns derrière les autres.

Quand les objets sont dessinés du plus loin au plus proche : 10 fps
Quand les objets sont dessinés du plus proche au plus loin : 17 fps
Le trie permet garantir le second cas.
Cette fonctionnalité permet d'ajouter encore des objets sans perte majeure de performances



Utilisez vous même Windmill ! (dernière maj : jour 17)
Le fichier G1A est maintenant disponible en téléchargement ⇩⇩⇩

Infos démo
Cliquer pour enrouler
Touches 4,5,6,2 pour se déplacer
Replay pour tourner la vue
x et ÷ pour monter et descendre
EXE pour interagir

Actions possibles : entrer/sortir dans la maison
ouvrir/fermer la trappe

Pour fermer l'appli, il faut retirer les piles, c'est pas une blague haha


Fichier joint



Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Dernier message de la page précédente :Posté le 09/11/2016 21:11 |
Cake :
On peut autoriser le moteur à piquer le flux (je me suis peut-être mal exprimé), mais il faut une interface non-bloquante sinon les possibilités sont restreintes

Ninestars :
Non-bloquant, c'est "le moteur ne prend pas le contrôle du flux d'exécution du programme".

Oh, donc basiquement tu as un tableau d'objets. Je sais pas trop ce que ça donnera avec des gros objets, mais c'est déjà pas mal. Ça a des inconvénients aussi, encore.
----------------------------------
Rise.



Pages: Précédente | 1, 2, 3, 4, 5, 6, 7, 8, 9, ... 21 | Suivante

Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 09/11/2016 21:36 | #
C'est ça. Après je ne sais pas si c'est la meilleure solution.
Si vous avez des idées je suis preneur
----------------------------------
Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Citer : Posté le 09/11/2016 22:38 | #
Pour moi une représentation performante doit donner accès en un temps minimal et de manière (raisonnablement) contigüe à une portion de l'espace, en particulier, celle qu'on veut afficher à l'écran. En gros : accéder aux objets proches de la caméra d'une manière non influencée par les objets qui en sont loin.
----------------------------------
Rise.
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 00:28 | #
Un peu dans le même esprit que cet exemple ?
C'est à dire qu'un sorte tri est effectué avant d'afficher les objets

Ajouté le 10/11/2016 à 00:30 :
Je peux faire un truc sympa dans le genre.
Pour chaque objet je défini une bounding box (une boite englobante) dans lequel l'objet sera contenu. Si aucun coin de cette boite n'apparait à l'écran alors je n'ai pas besoin de calculer et d'essayer d'afficher mes triangles qui sont à l'intérieur.
----------------------------------
Dark storm
Hors ligne
Membre d'honneur
Points: 10691
Défis: 174
Message
Citer : Posté le 10/11/2016 00:36 | #
Ben en soit tu peux gagner pas mal de temps en testant d'abord si les objets sont potentiellement à l'écran. Ça fonctionne très bien sur de gros environnements. Le coup de la bounding box c'est pas con du tout.

Sinon au niveau du moteur, t'as intérêt à ce que son fonctionnement soit le plus transparent possible. Pour le passage des objets, une liste de pointeur me semble être une bonne solution. À voir tout de même.
----------------------------------
Finir est souvent bien plus difficile que commencer. — Jack Beauregard
Páranÿe quetë Quendya
Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Citer : Posté le 10/11/2016 06:16 | #
Voilà, un quadtree ou un BSP sont des solutions tout à fait acceptables. Si vraiment t'es chaud, tu peux construire une interface qui autorise l'utilisateur à fournir lui-même ce partitionnement -- autorisant un développeur de Wolfenstein basique à exploiter à fond sa map 2D carrée stockée sous forme d'un double tableau.
----------------------------------
Rise.
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 10:45 | #
Dark storm a écrit :
Ben en soit tu peux gagner pas mal de temps en testant d'abord si les objets sont potentiellement à l'écran.
Cette solution est sûrement mieux que les histoires d'arbres ou de partitionnement. Le partitionnement est en fait efficace et simple en 2D, en 3D c'est beaucoup de complications.
Lephé, je n'ai pas envie de compliquer d'avantage le travaille du mec qui va déjà devoir taper des listes de nombres. Je veux un truc automatique transparent pour le programmeur.

Pour reprendre mon idée de bouding box, j'ai trouvé encore mieux. Au lieu de vérifier si les 8 sommets de ma boite sont dans la pyramide de vision, je vais vérifer si une sphère emglobante est dans mon cône de vision.
La symétrie de révolution simplifie énormement
----------------------------------
Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Citer : Posté le 10/11/2016 12:02 | #
Oui, j'ai toujours tendance à vouloir éliminer les pertes de puissance lorsqu'on ajoute une interface un peu générique x)

Dark storm a écrit :
Ben en soit tu peux gagner pas mal de temps en testant d'abord si les objets sont potentiellement à l'écran. Ça fonctionne très bien sur de gros environnements. Le coup de la bounding box c'est pas con du tout.

Aucun gain ou presque à mon goût. Tu te tapes quand même tout le tableau.
----------------------------------
Rise.
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 12:17 | #
Oui dans tout le tableau, mais un tableau beaucoup plus petit, seulement les "objets" et pas les "triangles des objets".
Dark storm et moi on pense à un algo qui ressemble à ça
pour chaque objet
  si sphère dans cône
    pour chaque triangle
      afficher triangle
    fin
  fin
fin

et toi lephé
chercher les objets a afficher
pour chaque objet
  pour chaque triangle
    afficher triangle
  fin
fin

La complexité réside dans la recherche des objets à afficher, et c'est un gros traitement, plus gros que vérifier si la sphère est dans le cône.
----------------------------------
Dark storm
Hors ligne
Membre d'honneur
Points: 10691
Défis: 174
Message
Citer : Posté le 10/11/2016 12:19 | #
C'est l'affichage (calcul des projections + accès à la vram) qui prend du temps. Faire une approximation rapide, c'est que dalle par rapport au reste, et ce même si tu parcours tout le tableau, parce que de toute façon il faudra le faire au moins une fois.

Ajouté le 10/11/2016 à 12:20 :
Attention aussi au calcul sphérique, ça peut vite prendre du temps de calcul si tu te démerde pas bien (multiplication au lieu de tests)…
----------------------------------
Finir est souvent bien plus difficile que commencer. — Jack Beauregard
Páranÿe quetë Quendya
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 12:28 | #
Hey ! Je suis le roi de l'optimisation :P
Qu'est ce que tu veux dire par multiplication au lieu de test ?
----------------------------------
Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Citer : Posté le 10/11/2016 12:29 | #
Un quadtree c'est plus ou moins la même complexité d'accès qu'un tableau en 3D hein. Sur un monde à la Minecraft tu n'as aucune raison de passer tous les blocs du monde alors que ceux qui sont visibles sont directement accessibles à partir des indices.
----------------------------------
Rise.
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 12:56 | #
Je ne comprends pas ta réponse Lephé, nous n'avons pas parlé de tableau 3D.
Et comment ça les blocs visibles sont accessible par leur indice ? Indice de quoi ?

Ajouté le 10/11/2016 à 13:11 :
D'ailleurs tu sais pourquoi la multiplication entière prend 2 à 5 cycles ? A quoi est dû cette variation ?
----------------------------------
Lephenixnoir
Hors ligne
Administrateur
Points: 13150
Défis: 136
Message
Citer : Posté le 10/11/2016 13:20 | #
Tu me dis que la recherche des objets visibles est un algorithme trop peu performant pour être intéressant par rapport aux bounding boxes. Ma réponse consiste à dire "ça dépend déjà de ta structure de données". Par exemple si j'implémente un Minecraft, mon monde sera un tableau 3D et la solution des bounding boxes sera très inefficace, alors que dans un tableau 3D, à partir des paramètres de la vue, on peut quasiment itérer les blocs visibles -- itérer, c'est une recherche à coùt 0.

Et ensuite je dis : le quadtree, c'est quasiment la vitesse de recherche d'un tableau 3D. Il n'y a même pas besoin de rechercher, il suffit de plonger dans les niveaux de l'arbre et les objets visibles s'offrent naturellement à toi. Alors que les bounding boxes vont seulement te permettre de sauter des grosses sphères (on pourrait faire l'analogie avec les chunks de Minecraft) et ne t'éviteront pas de t'intéresser à des objets qui sont à l'autre bout de la map. Sur des maps "suffisamment" grandes ce sera fatalement source de problèmes de performance.

Ajouté le 10/11/2016 à 13:22 :
Ben, la multiplication c'est pas de la magie. Il faut 2 cycles de calcul pour pouvoir libérer le proco et 3 de plus pour le multiplieur. Tu t'attendais à ce que ce soit aussi facile que l'addition ?
----------------------------------
Rise.
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 14:11 | #
Je vais faire un petit point. Il y a trois repères différents dans un monde 3D. Dans l'ordre il y a :
- Le repère d'un objet. C'est le repère propre d'un objet, par exemple un cube est compris entre (-1,-1,-1) et (1,1,1)
- Le repère du monde. Cela correspond au repère intuitif, les coordonnées d'un personnage par exemple sont exprimées dans ce repère.
- Le repère caméra/écran. C'est grosso modo les coordonées des pixels, x vers la droite, y vers le haut, z sort de l'écran.

Pour savoir si un objet est visible, il faut partir du repère de l'objet à celui du monde (en générale une simple translation) et faire la transformation pour passer du repère du monde à celui de la caméra (translation (x,y,z caméra) et rotation (pitch, yaw caméra)).
J'insiste sur le fait que le SEUL ET UNIQUE moyen de savoir si un point est visible est de transformer les coordonnées du point en question dans le repère de la caméra !
Il n'y a pas de moyen plus rapide. Minecraft ou pas

Avec ma sphère dans le cône, au lieu de transformer chaque point de chaque triangle jusqu'au repère caméra, je tranforme d'abord le point au centre de ma sphère (donc un seul point à tester) pour voir si il est dans le cône de vision (en prenant en compte son diamètre, mais j'en parle pas trop pour simplifier).
Si oui je tranforme tous les points de tous mes triangles inclus dans cette sphère.

Après ce que tu dis est juste : faire une bouding box pour chaque bloc est inutile, surtout que la bouding box correspond au bloc lui-même. Et ta remarque est juste, dans Minecraft les bouding box sont les chunks. (Je suppose qu'il regarde si le centre du chunk est dans le champs de vision ou non)

lephenixnoir a écrit :
Ben, la multiplication c'est pas de la magie. Il faut 2 cycles de calcul pour pouvoir libérer le proco et 3 de plus pour le multiplieur. Tu t'attendais à ce que ce soit aussi facile que l'addition ?
Non Je demandais pourquoi le nombre de cycle n'est pas fixe. Qu'est ce qui fait qu'une multplication prendra 2 et une autre 5 cycles ?

Ajouté le 10/11/2016 à 14:44 :
D'ailleurs si tu aurais le temps de rejetter un oeil sur le code que tu m'avais donné ça serait super
volatile struct Pok
{
    unsigned int TCOR;
    unsigned int TCNT;
    union
    {
        unsigned short WORD;
        struct
        {
            unsigned    :7;
            unsigned UNF    :1;
            unsigned    :2;
            unsigned UNIE    :1;
            unsigned CKEG    :2;
            unsigned TPSC    :3;
        };
    } TCR;

};

int execution_time()
{
    Pok *tmu = (Pok *)0xfffffe94;
    volatile unsigned char *tstr = (volatile unsigned char *)0xfffffe92;

    tmu->TCOR = 0xffffffff;
    tmu->TCNT = 0xffffffff;
    tmu->TCR.TPSC = 0;

    tmu->TCR.UNF = 0;
    tmu->TCR.UNIE = 0;
    tmu->TCR.CKEG = 0;

    *tstr |= 1;

    render_draw(&scene1);

    unsigned int counter = tmu->TCNT;
    *tstr &= ~1;

    return 0xffffffff - counter;
}
Quand j'execute ça me sors une erreur d'ecriture mémoire en FFFF FE9D
----------------------------------
Dark storm
Hors ligne
Membre d'honneur
Points: 10691
Défis: 174
Message
Citer : Posté le 10/11/2016 15:38 | #
Nan, je pense que ce qu'il veut dire, c'est que suivant la position de la caméra, tu peux itérer de manière intelligente. Exemple :

[green]0000000[/green]
[blue]0[/blue][green]00000[/green][blue]0[/blue]
[blue]00[/blue]\ /[blue]00[/blue]
[red]000[/red]–[red]000[/red]
[red]0000000
0000000[/red]


Les objets en vert, t'affiches sans te poser de question.
En bleu, tu peux appliquer ta bounding box.
En rouge, ça sert à rien de calculer la bounding box.

Ajouté le 10/11/2016 à 15:39 :
Et ça, ça s'itère (donc en 0(1) en effet).
----------------------------------
Finir est souvent bien plus difficile que commencer. — Jack Beauregard
Páranÿe quetë Quendya
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 15:47 | #
J'ai peut être pas été assez clair...
ON NE SAIT PAS CE QU'IL Y A DEVANT LA CAMERA AVANT DE L'AVOIR CALCULE

Dans ton exemple, la caméra regarde selon l'axe y du repère monde. Alors forcement c'est facile
----------------------------------
Dark storm
Hors ligne
Membre d'honneur
Points: 10691
Défis: 174
Message
Citer : Posté le 10/11/2016 18:33 | #
J'étais encore sur le fait que ton moteur était à la base prévu pour la vue de dessus, donc toujours selon l'axe y x)
----------------------------------
Finir est souvent bien plus difficile que commencer. — Jack Beauregard
Páranÿe quetë Quendya
Zezombye
Hors ligne
Rédacteur
Points: 1531
Défis: 12
Message
Citer : Posté le 10/11/2016 18:46 | #
Je demandais pourquoi le nombre de cycle n'est pas fixe. Qu'est ce qui fait qu'une multplication prendra 2 et une autre 5 cycles ?

Je dirais que ça dépend de la complexité de la multiplication, 2x2 prend moins de temps que 453*146.
----------------------------------
Divers jeux : Puissance 4 - Chariot Wars - Sokoban
Ecrivez vos programmes basic sur PC avec BIDE
Dark storm
Hors ligne
Membre d'honneur
Points: 10691
Défis: 174
Message
Citer : Posté le 10/11/2016 19:43 | #
Nan, ça dépend surtout du type de données traitées. La multiplication de réels est bien plus gourmande en cycles que celle d'entiers…
----------------------------------
Finir est souvent bien plus difficile que commencer. — Jack Beauregard
Páranÿe quetë Quendya
Ninestars
Hors ligne
Membre
Points: 2129
Défis: 22
Message
Citer : Posté le 10/11/2016 21:13 | #
Peut être que si le résultat de la multiplication rentre dans un short par exemple, il s'arrête et remplie le reste de 0. Peut être une gestion des signes aussi. Je ne sais pas.
Dark Storm, on parle uniquement de multiplication entière. La commande MUL.L en assembleur indique
" cycles : 2 (to 5)"
----------------------------------

Pages: Précédente | 1, 2, 3, 4, 5, 6, 7, 8, 9, ... 21 | Suivante

Index du Forum > Projets de programmation > Windmill : moteur graphique 3D

Planète Casio v42 © créé par Neuronix et Muelsaco 2004 - 2018 | Il y a 18 connectés | Nous contacter | Qui sommes-nous ? | Licences et remerciements

Planète Casio est un site communautaire indépendant, géré bénévolement et n'est donc pas affilié à Casio | Toute reproduction de Planète Casio, même partielle, est interdite
Les fichiers, programmes et autres publications présents sur Planète Casio restent la propriété de leurs auteurs respectifs et peuvent être soumis à des licences ou des copyrights.
CASIO est une marque déposée par CASIO Computer Co., Ltd