Créer le jeu de données
Les modèles personnalisés de visualisation sont destinés aux utilisateurs sans arrière-plan de science des données. En créant un jeu de données et en demandant à Vision d'entraîner un modèle basé sur le jeu de données, vous pouvez avoir un modèle personnalisé prêt pour votre scénario.
L'étiquetage de données consiste à identifier les propriétés d'enregistrements, tels que les documents, le texte et les images, et à les ajouter en tant qu'annotations pour identifier ces propriétés. La légende d'une image et l'identification d'un objet dans une image sont deux exemples d'étiquette de données. Vous pouvez utiliser Oracle Cloud Infrastructure Data Labeling pour effectuer l'étiquetage de données. Pour plus d'informations, consultez le guide du service d'étiquetage de données. Voici un aperçu des étapes à suivre :
- Collectez suffisamment d'images correspondant à la distribution de l'application prévue.
Lorsque vous choisissez le nombre d'images nécessaires pour votre jeu de données, utilisez autant d'images que possible dans votre jeu de données d'entraînement. Pour chaque étiquette à détecter, fournissez au moins 10 images pour l'étiquette. Fournissez idéalement 50 images ou plus par étiquette. Plus vous fournissez d'images, meilleure est la robustesse et la précision de la détection. La robustesse est la capacité de généraliser à de nouvelles conditions telles que l'angle de vue ou l'arrière-plan.
- Recueillez quelques variétés d'autres images pour capturer différents angles de capture de caméra, conditions d'éclairage, arrière-plans et autres.
Collectez un jeu de données représentatif du problème et de l'espace sur lequel vous prévoyez d'appliquer le modèle entraîné. Bien que les données d'autres domaines puissent fonctionner, un jeu de données généré à partir des mêmes appareils, environnements et conditions d'utilisation, surpasse les autres.
Fournir suffisamment de perspectives pour les images, car le modèle utilise non seulement les annotations pour apprendre ce qui est correct, mais aussi l'arrière-plan pour apprendre ce qui ne va pas. Par exemple, fournissez des vues de différents côtés de l'objet détecté, avec des conditions d'éclairage différentes, de différents dispositifs de capture d'image, etc. - Étiqueter toutes les instances des objets qui se produisent dans le jeu de données source.Gardez les étiquettes cohérentes. Si vous étiquetez plusieurs pommes ensemble comme une seule pomme, faites-le régulièrement dans chaque image. Il n'y a pas d'espace entre les objets et la zone englobante. Les zones englobantes doivent correspondre étroitement aux objets étiquetés.Important
Vérifiez chacune de ces annotations car elles sont importantes pour la performance du modèle.