Gemini-Translation:GeminiAPIを使用した翻訳アプリ(Pythonとexe版有り)

2024年11月2日 23:39

初めに

大変困ったことにOpenAI-TranslatorでGeminiAPIを使用して翻訳しようとした場合、エラーが発生するようになったのですが、エラー発生から2週間ほど立ちましたが修正されること無く、先日のアプデでも修正されなかったため、代替のアプリを作成することにしました。

残念ながらすべての機能を実装しているわけではありません。まず、選択した所に、アイコンが出てそこをクリックすると翻訳される機能は、コードは作成できたのですが機能が安定せず、アイコンが出るタイミングがまちまちだったりしたため、実装を見送りました。

また、OCR機能やTTS機能なども実装していません。

他の似たようなアプリとしてはPOTがあり、試用していましたがこちらもGeminiAPIでの翻訳ができなくなったため利用を断念しました。

Gemini-Translation&Summarize-FutagoHonyakuのインストールと初期設定

こちらのgithubのレポジトリから、インストールしてください。
https://github.com/willailora/gemini-translator
exe版は仕様上、毎回起動時に展開を行うので、使用できるようになるまでそこそこ時間がかかります。

初期設定

起動するとこのようなウィンドウが表示されます。まずは左上の⚙APIボタンを押して、APIの設定をしましょう。APIKEYを入力してSaveボタンを押してください。

APIKEYの取得の仕方はこちらをご参照ください。
設定したらお手数ですが一旦アプリを再起動してください。一度入力すれば、次回以降の入力は不要です。
APIKEYが正しければ、モデルが読み込まれるので、下の画像のようにモデルを選択できるようになります。

モデルは一度選択したら、次回も同じモデルが選択されます。
フォントサイズは8-24ptの範囲で設定可能です。適宜選択してください。こちらも、変更すると保存され、次回も同じ数値で開始されます。
フォントサイズが適用されるのは、SourceとResultの表示部分のみです。

Gemini-Translation&Summarize-FutagoHonyakuの機能

実装されている機能は翻訳と要約になります。デフォルトのプロンプトはシンプルなものになっていて英訳ぐらいしか出来ませんが、プロンプトの変更機能を備えていますので、例えば以下のようなプロンプトに変更することで、おそらく全言語対応になります。ついでに要約もつけるようにしています。
「あなたはプロフェッショナルな翻訳家です。提示した文書を、まず、一字一句丁寧に省略や要約すること無く全文を翻訳してください。また余計な文言を付け加えてもいけません。すべての翻訳が完了したら、要約を作成し[]で囲んで表示してください。:
{text}」
プロンプトの変更は左上の⚙APIボタンのsettings内のTlanslatePromptとSummarizePromptを変更して、Saveボタンを押すとプロンプトの変更が適用されます。
こちらも、一度変更すれば次回以降は変更したプロンプトが適用されています。
プロンプトの注意点として、必ず最後に「:
{text}」（改行も必要）を付加する必要があります。これがないと、Source内のテキストが読み込まれませんので、ご注意ください。

翻訳と要約の仕方

Source入力欄にtextを入力した後に、🌎️の絵文字のボタンを押すと翻訳が開始されます。
✒️のボタンを押すと要約になります。

設定したプロンプトによって挙動は変わるので、要約じゃなくて別のことをさせることも可能です。

ショートカットキーによる翻訳

Ctrl+Alt+Tの同時押しで、現在範囲指定しているtextがSourceに送られて、自動で翻訳を開始します。挙動安定のために少しだけレイテンシを設けています。申し訳ありませんが、ショートカットキーの変更機能は実装していません。

翻訳・要約結果の自動保存

アプリのあるフォルダ内にlogフォルダが自動作成され、年月日時間分秒.txtで結果が保存されるようになっています。

このような形で保存されます。特にボタンを押す必要はなく自動です。要約が付いているのはプロンプトを変更しているためです。

アプリのあるフォルダに保存するため、フォルダによっては機能しない可能性があるので、その場合は権限を確認するか、アプリの場所を変更してください。

ウィンドウの移動とリサイズ

ウィンドウの移動は狭いですが、枠をマウスでホールドすれば自由に移動可能です。
ウィンドウのリサイズは右下の三角部分をマウスでホールドして移動すれば、自由に変更可能です。

config.jsonとwindow_config.jsonについて

config.jsonには、APIKEYとフォントサイズ、選択しているモデル、翻訳用プロンプトと要約用プロンプトが保存されています。
APIKEYは他人に使用されないように適切に保管してください。
window_config.jsonにはウィンドウサイズと位置が保存されています。何かで、位置がおかしくなった場合はこのファイルを削除すれば、デフォルトの位置にウィンドウが出現します。

おまけ

アイコンと同じこのページの表紙画像は、コードをClaude3.5Sonnetに見せて、Flux用の画像生成のプロンプトを作成してくださいとお願いして、でてきたプロンプトで作成したものです。アイコンはPythonで画像をいれると、.icoファイルを作成してくれるものを使用。これは以前Claude3Opusに作ってもらったコードです。

import os
from tkinterdnd2 import DND_FILES, TkinterDnD
from tkinter import Label
from PIL import Image

def create_ico(file_path, sizes):
    img = Image.open(file_path).convert("RGBA")  # 透明度を保持するためにRGBAモードに変換
    icon_sizes = []
    for size in sizes:
        icon = img.resize((size, size), Image.Resampling.LANCZOS)
        icon_sizes.append(icon)  # アイコン画像オブジェクトをリストに追加
    ico_path = os.path.splitext(file_path)[0] + '.ico'
    # 32ビット深度でICOファイルを保存
    img.save(ico_path, format='ICO', sizes=[(icon.size[0], icon.size[1]) for icon in icon_sizes], bits=32)
    return ico_path

def on_drop(event):
    file_path = event.data
    if file_path:
        try:
            sizes = [16, 32, 48, 64, 128, 256]  # アイコンのサイズを指定
            ico_path = create_ico(file_path, sizes)
            label.config(text=f'変換完了: {os.path.basename(ico_path)}')
        except Exception as e:
            label.config(text=f'エラー: {str(e)}')

if __name__ == '__main__':
    root = TkinterDnD.Tk()
    root.title('Image to ICO Converter')
    root.geometry('400x300')

    label = Label(root, text='画像ファイルをここにドラッグしてください')
    label.pack(pady=20)

    root.drop_target_register(DND_FILES)
    root.dnd_bind('<<Drop>>', on_drop)

    root.mainloop()

ドネーションをしてくれる方は以下のURLからお願いします。 https://ko-fi.com/ailorawill

連絡先プロジェクトに関する質問やコメントがある場合は、https://x.com/plionplionか、Discordで@willlionまでご連絡ください。

いいなと思ったら応援しよう！

コメントするには、ログインまたは会員登録をお願いします。

Gemini-Translation:GeminiAPIを使用した翻訳アプリ(Pythonとexe版有り)

初めに

Gemini-Translation&Summarize-FutagoHonyakuのインストールと初期設定

初期設定

Gemini-Translation&Summarize-FutagoHonyakuの機能

翻訳と要約の仕方

ショートカットキーによる翻訳

翻訳・要約結果の自動保存

ウィンドウの移動とリサイズ

config.jsonとwindow_config.jsonについて

おまけ

いいなと思ったら応援しよう！

コメント

海外のニュースを翻訳＆解説＆まとめてくれるアプリを作った【GoogleAIStudio】

【無料＆最強】DeepL課金卒業。Gemini 2.0で「現役エンジニアが作った爆速翻訳ツール」を自作したら世界が変わった話【ソースコード配布…

Gemini APIの無料枠が厳しくなったので、回避するChrome拡張機能を作ってみた

【🤖Gemini活用】GeminiのAPIキーで使用できるモデルを知らずにハマった話 | 確認方法もご紹介

【無料版】Googleアカウントひとつで、PCの中に「最強の秘書」を雇ってみませんか？｜Gemini活用ガイド

noteの多言語対応

【無料配布】Geminiのチャット履歴を1クリックでテキスト保存するChrome拡張機能を作りました

浮世絵

Geminiと共創 【番外編001】

【2/13まで90%OFF】Geminiのプロンプト管理はこれ１つで完結。AIが勝手に「最強の指示」に書き換える自分専用アプリを作りました（AppShe…

Geminiで論文要約！精度と効率を劇的に上げるプロンプトとコツ

ローカルAIを使ってModの翻訳をしてみた話

【無料でここまで使える】Geminiの無料版でできること・できないこと完全ガイド

kintoneアプリアイコンメーカーを作ってみた

Geminiで漫画を作ってもらうもまだ日本語が不完全。。

資料を翻訳したい！手直ししたい！Googleスライド内のGeminiサイドパネルの活用でできること（スライドの編集・作成）

GeminiAI：英語動画ファイル(MP4)への字幕埋め込み

ブラウザが「最強の秘書」に。Gemini in Chromeの衝撃的な便利さと使い方

Zoteroに乗り換えて、Gemini APIで論文を自動要約するプラグインを自作した話

知識ゼロでもGeminiとなら作れる！完全無料の自分専用TOEICアプリ開発記【目指せ800点】

生成メモ：思考実験『2030年のAIと心理臨床』

Android Studio Gemini 設定手順

【windows】GeminiCLI導入して色々してみる

「#141」 Gemini APIのFile Search Toolを使ってみた

GeminiアプリをiPhoneのSiriに頼んで起動する方法。

無料版Claudeでwebアプリを作ってみた

GeminiのNano banana Proが凄い？

難しい書類はGeminiに任せて、コーヒーを飲もう。PDFをドラッグするだけの「やさしい時短術」

FileSearchToolで簡単にRAGがつくれるらしい

完全日本語の翻訳Bot!?

パソコンでGoogle Geminiを簡単に

Gemini（スマホ）

Google AI「Gemini」に新機能。「今すぐ回答」ボタンの日本語化で、AIの回答待ち時間を最適化

【保存版】英語ができなくても大丈夫。Geminiで世界の最新トレンドを「日本語」で掴む魔法のプロンプト集

Notionオタクが2週間Obsidianを使ってみて感じたこと

「LYPプレミアム」がiF DESIGN AWARD 2025を受賞しました

海外のニュースを翻訳＆解説＆まとめてくれるアプリを作った【GoogleAIStudio】

【無料＆最強】DeepL課金卒業。Gemini 2.0で「現役エンジニアが作った爆速翻訳ツール」を自作したら世界が変わった話【ソースコード配布】

Gemini APIの無料枠が厳しくなったので、回避するChrome拡張機能を作ってみた

【🤖Gemini活用】GeminiのAPIキーで使用できるモデルを知らずにハマった話 | 確認方法もご紹介

【無料版】Googleアカウントひとつで、PCの中に「最強の秘書」を雇ってみませんか？｜Gemini活用ガイド

noteの多言語対応

【無料配布】Geminiのチャット履歴を1クリックでテキスト保存するChrome拡張機能を作りました

浮世絵

Geminiと共創 【番外編001】

【2/13まで90%OFF】Geminiのプロンプト管理はこれ１つで完結。AIが勝手に「最強の指示」に書き換える自分専用アプリを作りました（AppSheet × GAS）

Geminiで論文要約！精度と効率を劇的に上げるプロンプトとコツ

ローカルAIを使ってModの翻訳をしてみた話

【無料でここまで使える】Geminiの無料版でできること・できないこと完全ガイド

kintoneアプリアイコンメーカーを作ってみた

Geminiで漫画を作ってもらうもまだ日本語が不完全。。

資料を翻訳したい！手直ししたい！Googleスライド内のGeminiサイドパネルの活用でできること（スライドの編集・作成）

GeminiAI：英語動画ファイル(MP4)への字幕埋め込み

ブラウザが「最強の秘書」に。Gemini in Chromeの衝撃的な便利さと使い方

Zoteroに乗り換えて、Gemini APIで論文を自動要約するプラグインを自作した話

知識ゼロでもGeminiとなら作れる！完全無料の自分専用TOEICアプリ開発記【目指せ800点】

生成メモ：思考実験『2030年のAIと心理臨床』

Android Studio Gemini 設定手順

【windows】GeminiCLI導入して色々してみる

「#141」 Gemini APIのFile Search Toolを使ってみた

GeminiアプリをiPhoneのSiriに頼んで起動する方法。

無料版Claudeでwebアプリを作ってみた

GeminiのNano banana Proが凄い？

難しい書類はGeminiに任せて、コーヒーを飲もう。PDFをドラッグするだけの「やさしい時短術」

FileSearchToolで簡単にRAGがつくれるらしい

完全日本語の翻訳Bot!?

パソコンでGoogle Geminiを簡単に

Geminiと共創【番外編001】

Geminiと共創【番外編001】