Skip to content

Latest commit

 

History

History
278 lines (238 loc) · 18.9 KB

README.fr.md

File metadata and controls

278 lines (238 loc) · 18.9 KB

README.md

🎶 Whisper Mate - Transcription locale en lot de fichiers audio/film en texte avec le modèle de Whisper AI. Gardez votre vie privée en sécurité!

  Télécharger la dernière version depuis le Mac App Store   capture d'écran  

Fonctionnalités

Whisper Mate prend en charge la transcription en lot de fichiers audio ou vidéo en texte avec le modèle de Whisper AI d'OpenAI. Avec un éditeur de sous-titres intégré pour prévisualiser le résultat de la transcription segment par segment. Toutes les opérations de transcription sont effectuées localement sur votre machine. Protégez votre vie privée.

V5.5.1

  • Correction d'un plantage lors de la traduction automatisée à la fin du projet
  • 148 Mo

V5.5.0

  • Ajout de l'option du modèle Deepgram nova-2
  • Ajout du support de la fenêtre flottante de transcription en temps réel avec un pourcentage de transparence personnalisable
  • Ajout de l'option de transcription en temps réel pour afficher uniquement le contenu traduit
  • Ajout d'options de style personnalisées pour la fenêtre flottante en temps réel (couleur de fond, couleur de la police)
  • Correction des options d'automatisation qui ne sont pas invoquées lors de l'utilisation du moteur de transcription de deepgram
  • Correction d'un problème avec la fermeture de la fenêtre flottante de transcription en temps réel
  • 148 Mo

V5.4.9

  • Ajout de la fonctionnalité de modèle d'exportation en lot de projets, permet d'exporter le résultat des projets sélectionnés dans un fichier à partir d'un script de modèle
  • Corrections de bugs et améliorations des performances
  • 148 Mo image

V5.4.8

  • Ajout des paramètres de confidentialité dans la barre d'état inférieure de la fenêtre principale, permet de désactiver l'analyse des événements, les rapports d'erreur et les journaux locaux
  • Ajout d'un exemple de script pour supprimer les lignes correspondant à des conditions
  • Ajout d'un exemple de script pour remplacer une chaîne de sous-titres du type '(Musique) * Musique * [Musique]' par une chaîne vide
  • Ajout des propriétés .memo .markWarn .warnMsg pour l'écriture de script
  • Ajout de l'option d'affichage du délai des sous-titres dans l'éditeur de sous-titres
  • Ajout de la modification en lot des heures de début ou de fin des sous-titres dans l'outil d'édition de sous-titres
  • Ajout du raccourci (⇧)+←→ dans l'éditeur de sous-titres pour passer rapidement de 5 secondes ou 30 secondes dans le lecteur de prévisualisation
  • Ajout de la barre de contrôle des haut-parleurs et prise en charge du réglage rapide avec des raccourcis
  • Correction de l'impossibilité de masquer les sous-titres de l'aperçu
  • Correction de l'impossibilité de couper du texte dans l'éditeur de modèle et de la sélection par glisser-déposer
  • Correction du format de la plage de temps exportée personnalisée .t0f5 .t0f4 .t0f2 qui renvoie toujours un chiffre à 3 chiffres en milliseconde
  • 148 Mo

V5.4.7

  • Ajout de l'option de démarrage automatique du projet lorsqu'un fichier est ajouté à la liste des projets (le commutateur est situé dans la barre d'état inférieure de la fenêtre principale)
  • Ajout de l'étape d'automatisation pour exporter automatiquement les fichiers vers un dossier personnalisé
  • Ajout de l'étape d'automatisation pour envoyer le résultat par e-mail dans votre boîte mail (peut utiliser automatiquement le résultat précédent comme pièce jointe)
  • Mise à niveau de l'éditeur de modèle et de javascript pour corriger les problèmes de plantage
  • 148 Mo image

V5.4.6

  • Ajout de l'option de disposition des sous-titres dans la prévisualisation multimédia, le sous-titre de la source et le sous-titre traduit peuvent être affichés en haut ou en bas.
  • Ajout du grand modèle v3 coreml
  • Ajout du raccourci ⌘+⌥+f ou double-clic sur la prévisualisation pour passer rapidement en plein écran
  • Certains raccourcis prennent désormais en charge l'appui d'une seule touche (fusionner, diviser, ajuster)
  • Après la fusion des sous-titres, la première ligne fusionnée est automatiquement sélectionnée
  • Annulation de l'association de l'application par défaut à Whisper Mate pour les fichiers audio et vidéo
  • Correction de certains bugs de plantage dans la version 5.4.5
  • Correction du problème d'affichage des notifications
  • Correction de certains problèmes de traduction
  • 123 Mo

image

V5.4.5

  • ❗La version universelle doit être téléchargée à nouveau. J'ai mis à niveau mon appareil de développement et j'ai oublié de sauvegarder la clé universelle d'implémentation EDKey.
  • Ajout de la fonctionnalité d'automatisation pour exécuter des tâches lorsque la transcription d'un projet est terminée (Merge repeats/Snapshot/Script/Translate)
  • Ajout de l'option de longueur maximale du segment de transcription
  • Ajout d'exemples de modèles de messages
  • Ajout de la possibilité de remplacer par le caractère '\n' (un seul antislash avec le caractère n) pour passer à la ligne dans la fonction de remplacement
  • Mise à niveau de l'interface de configuration des options de transcription du projet
  • 122 Mo

image

V5.4.4

  • Ajout de la liste cloud des modèles dans le panneau de configuration des modèles avec le support de 2 serveurs de téléchargement (passer à l'hôte 2 si vous ne pouvez pas le télécharger depuis l'hôte 1)
  • Support de secours en utilisant le module CoreML lors de la désactivation de l'option Accélération du GPU dans les paramètres généraux
  • Correction de l'échec du téléchargement du modèle volumineux
  • Correction du plantage sur les appareils non Apple Silicon
  • Télécharger la version universelle 122 Mo

V5.4.3

  • Amélioration de la vitesse de transcription
  • Ajout du support du modèle Whisper large v3
  • Ajout du support du moteur de LibreTranslator
  • Ajout de la duplication de projet dans le menu contextuel du projet
  • La mise à jour du champ de haut-parleur permet une entrée directe en mode édition (⌘+E)
  • Correction du problème de fenêtre en onglets lorsque le nombre d'onglets > 2
  • Correction du crash du visualiseur de forme d'onde parfois
  • Correction de la traduction dans l'éditeur de sous-titres qui ne fonctionne pas avec les lignes sélectionnées

V5.4.2

  • Ajout de l'option de configuration du nombre de threads de traitement Whisper (Utiliser moins de threads pour permettre à l'ordinateur d'effectuer d'autres tâches, mais le temps de traitement augmentera)
  • Ajout du support du moteur de transcription Deepgram, également pris en charge en mode de transcription en continu en temps réel
  • Ajout d'exemple de modèle pour exporter uniquement le contenu personnalisé du locuteur
  • Ajout d'une fonction de recherche de mot-clé commençant par @ pour filtrer les lignes du locuteur ou remplacer tous les noms du locuteur par un autre nom (ex : @tom-->jack)
  • Ajout de la fonctionnalité de sauvegarde de la configuration des locuteurs du projet le plus récent et de sa réutilisation dans un nouveau projet
  • L'exportation personnalisée du modèle prend désormais en charge 9 modèles personnalisés

V5.4.1

  • Ajout de la fonctionnalité de gestion à distance du site web intranet, permet d'ajouter des fichiers à traiter et de voir l'état de traitement à partir de votre téléphone ou autre appareil (dans la barre d'état inférieure de la fenêtre principale)
  • Ajout du sélecteur de modèle de configuration des paramètres d'IA
  • Ajout du paramètre de suppression de la ponctuation de transcription
  • Ajout de la possibilité d'utiliser le module http sync pour effectuer des requêtes http synchrones (vous pouvez l'utiliser pour envoyer les données de la ligne de sous-titre à votre service llm local pour obtenir un résultat corrigé, puis le renvoyer au sous-titre d'origine, ou l'envoyer à un autre service système http/https, chargez l'exemple http depuis le processeur javascript pour voir comment l'utiliser)
  • Correction de l'erreur de débruitage du fichier wav lorsque le chemin du fichier contient un espace

V5.4

  • Ajout de la fonctionnalité de découpe rapide
  • Ajout du raccourci (c) pour afficher ou masquer la prévisualisation de l'éditeur de sous-titres
  • Ajout du raccourci pour changer la vitesse de lecture de la prévisualisation de l'éditeur de sous-titres
  • Remplacement de la stratégie silencieuse par la stratégie par blocs
  • Correction du bogue de l'option de débruitage
  • Télécharger la version universelle 122 Mo

La nouvelle fonctionnalité de découpe rapide a les fonctionnalités suivantes :

  • Visualiser la forme d'onde audio pour localiser et découper avec précision des vidéos
  • Diviser les fichiers multimédias plus longs en plusieurs segments pour un traitement séparé avant la transcription
  • Utiliser la stratégie par blocs pour sauter les segments silencieux ou non transcriptionnels
  • Découper séparément les segments qui nécessitent une transcription en fichiers individuels

V5.3.1

  • Ajout de l'attribut de priorité du projet dans la file d'attente de traitement en lot, une priorité plus élevée sera traitée en premier (L'option se trouve dans le menu contextuel)
  • La fonction de remplacement du texte des sous-titres remplace également les mots clés correspondants dans le texte traduit
  • Correction des problèmes de ré-transcription avec la stratégie de saut silencieux et de réduction du bruit

V5.3

  • Ajout de modèles plus affinés (petits/moyens) pour les langues
  • Ajout de la stratégie de saut des segments silencieux lors de la transcription (classifiés par décibels et durée de silence)
  • Ajout de l'option pour réduire le bruit de fond
  • Ajout de l'option pour masquer les sous-titres de transcription avant l'heure d'affichage (pas de spoil)
  • Ajout d'un exemple de processeur javascript pour mettre en majuscule les sous-titres des segments

V5.2

  • Ajout de modèles affinés pour l'inférence dans différentes langues. cantonais/zh/ko/jp/de/fr/th/uk...
  • Ajout de la fonction pour ajouter un modèle de Whisper AI personnalisé à Whisper Mate
  • Ajout de la fonction pour configurer en lot les paramètres du modèle du projet
  • Ajout de l'option pour empêcher le lancement du mode économiseur d'écran en cas de file d'attente en cours
  • Correction de la mise en pause de la tâche de traitement lorsque le mode économiseur d'écran est lancé
  • Correction du problème de navigation de la position du lecteur sur une ligne de sous-titre dans l'éditeur

V5.1

  • Ajout de la fonctionnalité d'exporter en lot les segments/sous-titres/modèles des projets avec l'option de les combiner en un seul fichier
  • Ajout de la fonctionnalité de ré-transcrire les lignes sélectionnées avec des paramètres d'IA différents
  • Ajout de la fonctionnalité d'annuler ou de rétablir les modifications de texte dans le contenu des sous-titres avec des modifications manuelles (Raccourcis ⌘+Z annuler / ⌘+⇧+Z rétablir)
  • Ajout de la fonctionnalité d'ajouter une nouvelle ligne de sous-titre vide en dessous de la ligne sélectionnée (Raccourcis ⌘+N)
  • Ajout de la fonctionnalité d'envoyer une notification de fin de projet via un webhook entrant Slack (Vous pouvez recevoir une notification sur votre téléphone lorsque chaque projet de transcription est terminé)
  • Correction de l'emplacement de la boîte de contrôle de lecture des médias lorsque la mise en page est en style haut-bas

V5.0

  • Ajout d'un kit pour fusionner rapidement les sous-titres dans des paragraphes consécutifs
  • Ajout du processeur de script personnalisé pour ajuster en lot les sous-titres transcrits
  • Ajout de la fonction de réglage de l'éditeur de sous-titres. Il est similaire à la fonction de division et de fusion. Il peut sélectionner plusieurs lignes, puis les ajuster dans un champ de texte ligne par ligne
  • Ajout du support des raccourcis dans l'éditeur de sous-titres
  • Ajout de la police personnalisée pour le style des sous-titres de prévisualisation vidéo dans le panneau de configuration des préférences
  • Ajout de la police personnalisée pour graver les sous-titres sur la vidéo d'origine et personnaliser le style des sous-titres
  • Ajout du support de l'exportation au format PDF ou DOCX, en spécifiant simplement le suffixe de l'exportation en pdf ou docx
  • Ajout de plusieurs formats d'exemples d'exportation prédéfinis. Vous pouvez les charger à partir d'un exemple puis les ajuster facilement
  • Ajout de la fonction pour effectuer des captures d'écran de l'état actuel des sous-titres d'un projet. Il est ensuite facile de revenir à la sauvegarde précédemment effectuée
  • Ajout de la fonction pour importer un fichier .srt dans le projet actuel en tant que sauvegarde.
  • Ajout de l'option pour afficher le texte traduit par-dessus le texte d'origine dans la prévisualisation vidéo des sous-titres
  • Ajout de fonctions d'exportation personnalisées. nombres aléatoires, identifiant global unique aléatoire, escXML et replaceString avec un format personnalisé
  • Ajout d'une option personnalisée pour le type de sortie de l'exportation (fichier ou presse-papiers)
  • Ajout d'une option personnalisée pour utiliser tous les sous-titres pour l'exportation ou seulement ceux sélectionnés
  • Ajout de l'option de regroupement des fenêtres d'édition de projet avec la fenêtre principale
  • Ajout de paramètres supplémentaires de configuration des processus du modèle Whisper dans le sélecteur de modèle (coin inférieur droit), qui peut être difficile à trouver, car la plupart du temps il n'est pas nécessaire de modifier ces paramètres
  • Optimisation du comportement de la prévisualisation vidéo en plein écran
  • La recherche par mot-clé prend en charge la condition OU (utilisez | comme mot-clé ou, par exemple "hi|hello|hey")
  • Optimisation de la logique de recherche et de remplacement. Lorsque l'exécution du remplacement, la recherche des mots clés ajustera pour afficher les mots clés source et remplacés
  • Optimisation de la logique de transcription en continu en temps réel
  • Correction de certains problèmes d'affichage des sous-fenêtres qui ne passent pas au premier plan
  • Correction des problèmes d'exportation au format XML
  • Correction de certains problèmes d'extraction audio des médias
  • Correction de l'action de remplacement qui s'exécutait automatiquement lors de la sortie du champ de mot-clé de remplacement
  • Correction de certains problèmes de plantage du projet en continu

V4.0

  • Ajout de la fonctionnalité pour mémoriser les propriétés de mise en page de l'éditeur de sous-titres du projet. Chaque projet peut utiliser une mise en page et une taille de lecteur de prévisualisation différentes. (les anciens projets doivent être ouverts à nouveau pour mémoriser les propriétés de mise en page)
  • Ajout de l'option pour rechercher les doublons dans l'éditeur
  • Ajout de l'option du menu contextuel pour ouvrir l'éditeur même si le traitement du script de transcription n'a pas commencé
  • Ajout de l'exportation de sous-titres au format .sbv
  • Ajout des fonctionnalités de modèles d'exportation personnalisés (comme .fcpxml, .itt, .ttml)
  • Ajout de nouveau(s) plugin(s)
  • Ajout des mots clés fréquemment utilisés et de la configuration de remplacement pour une réutilisation rapide de la recherche ou du remplacement
  • Ajout de l'affichage d'une marque sur les lignes marquées dans la vue de progression du lecteur de prévisualisation
  • Ajout de l'option de marquage dans le menu contextuel de l'éditeur de sous-titres
  • Ajout de la fonction de division de ligne dans l'éditeur de sous-titres lors de la sélection d'une seule ligne
  • Ajout de l'affichage du nom du projet dans les résultats de recherche
  • Ajout de l'affichage des erreurs lorsque les médias rencontrent une erreur lors de la préprogression
  • Ajout de l'option pour masquer le bouton de localisation de la ligne de l'éditeur
  • Ajout du raccourci ⌘+S pour exporter rapidement le fichier .srt vers un fichier
  • Correction du problème d'information audio de la chaîne audio du média qui en contient en réalité une seule (ajout d'une option pour ignorer la sélection de la chaîne audio)
  • Correction de l'échec de la gravure des sous-titres lorsque le nom du projet a été modifié manuellement
  • Correction de certains problèmes d'affichage de l'interface utilisateur sous macOS 12
  • Correction de la fonction de collage de fichiers copiés avec ⌘+V pour les mettre dans la file d'attente de traitement
  • Affichage du pourcentage d'utilisation du processeur lors du traitement Whisper
  • Support de l'archivage des projets via le menu contextuel (garde la liste de projets en cours de travail propre)
  • Support de la traduction des sous-titres avec Google Translate
  • Aperçu vidéo en plein écran avec mise en page des sous-titres
  • Support de l'ouverture de fichiers multimédias dans le Finder avec l'option "Ouvrir avec"
  • Support de la conversion multi-langue
  • Support de la conversion ou de la traduction dans des langues fréquemment utilisées

Captures d'écran

capture d'écran

capture d'écran1

capture d'écran2

capture d'écran3

capture d'écran4

capture d'écran5

capture d'écran6

capture d'écran7

capture d'écran8

capture d'écran10

capture d'écran11

capture d'écran12

capture d'écran13

capture d'écran14

capture d'écran15

capture d'écran16