2013年、最強のOCRは?
1 :名無しさん@お腹いっぱい。 :2013/07/31(水) NY:AN:NY.AN ID:wsG9QjLf.net 読取革命 e.typist Adobe Acrobat PDF Xchange Viewer 読んde!!ココ ScanSnap Organizer とか 電子化する大きなメリットとなる検索可能な自炊本にするためのOCR情報スレdeath
54 :名無しさん@お腹いっぱい。 :2013/12/09(月) 19:59:41.86 ID:YK1q4d3s.net e.typist使ってるけど、ルビまでいい感じで読み取るけど? そのまま青空形式でルビを書き込むようにしてる。
55 :名無しさん@お腹いっぱい。 :2013/12/09(月) 21:40:25.53 ID:nWZ+r3Cm.net >>54 え、それほんと? 初耳 電子インクの電子書籍端末がいい感じで普及してきたのに、ルビつきのepubが簡単に自炊できるソフトがないことが最大のネックになってた
56 :名無しさん@お腹いっぱい。 :2013/12/10(火) 00:11:47.09 ID:ZC2PoFMy.net e.typist neoの出荷メール来た 読取と両方試用版試したけど決め手はルビ出力の可否 認識率は本文より低い感じだけど二重山カッコでくくってくれるので 底本参照の校正がはかどるのではないかと思いまして とは言え認識率が100パーで無い限り底本突合せで間違い探しする訳で根気ないと無理ですねこれは どうしても残したく且つ電書化の可能性が限りなく低そうな手持ちの本限定…って感じです
57 :名無しさん@お腹いっぱい。 :2013/12/10(火) 00:22:53.69 ID:u4muTkK4.net 青空形式のルビ《 》もルビ開始位置の|も指定できるけど、本文でさえ校正が大変なのにルビまでは出来んわ
58 :名無しさん@お腹いっぱい。 :2013/12/20(金) 19:26:33.98 ID:YWA5PXvs.net 未だにsmartOCRをDLできる国外サイトいっぱいあるけど あれって英数字だけだと月並み。 結局利用者は大概日本人か
59 :名無しさん@お腹いっぱい。 :2013/12/23(月) 20:43:32.27 ID:c3bY1Jmf.net OCRは、高圧縮pdfを吐かせるためで 誤認識は気にしない、だいたい認識してくれれば検索も役には立つ と割り切って無修正で使っている
60 :名無しさん@お腹いっぱい。 :2014/01/28(火) 12:26:31.55 ID:ncWCbP7Q.net google docsが最強だろjk しかも無料だし
61 :名無しさん@お腹いっぱい。 :2014/06/01(日) 13:41:10.19 ID:gZHlEIFi.net >>61 上がるよ、フォトショで背景全部飛ばして文字の太さやらも調整する
62 :名無しさん@お腹いっぱい。 :2014/06/01(日) 13:44:08.20 ID:4XblVqBZ.net >>61 ホントにホントに?
63 :名無しさん@お腹いっぱい。 :2014/06/05(木) 10:44:39.50 ID:5NUrKheB.net 書籍は画像で保存していて、 OCRかけて検索可能PDFにするのは自分は諦めてるんだけど、 画像内の文字列をちょこっと選択して、 Google検索だけしたいとはよく思う。
64 :名無しさん@お腹いっぱい。 :2014/08/07(木) 08:08:09.99 ID:nQfWpHNh.net ビューアでそんなの出てほしいな 手動で範囲選択してそこだけOCRかけてweb検索やら辞書検索やらする
65 :名無しさん@お腹いっぱい。 :2014/12/25(木) 21:01:09.03 ID:5hKxSpYV.net 読取革命のアクチベーションはどのバージョンからですか?
66 :名無しさん@お腹いっぱい。 :2015/03/24(火) 00:36:12.86 ID:4AGjMhFZ.net うちの文鳥は特別に可愛い たぶん他のところのより可愛い そうとしか思えないくらい可愛い でもそう思っている飼い主ってけっこう多い?
67 :ギンコ ◆BonGinkoCc :2015/05/01(金) 05:36:53.74 ID:iCfLgs4D.net 読んde!!ココ パーソナル(エプソン版) 画像の読み込みは白黒でしか対応していないため、 モノクロビットマップに変換してやる必要がある。 ※元ファイルを消してしまわないため、コピーを別ディレクトリに保存した方が安全。 とりあえず光学文字認識をしてしまい、あとは愛用のエディタを用い、 元ファイルの画面を参照しながら手作業で直していく。 自動文章認識機能に頼りきっていては、なめらかな文字認識ができないため、 きめ細かな修正はやはりオペレーター(ユーザー)が行うしか無いのだ。 Google翻訳で日本語から英語へ翻訳する際、長文のニュースサイト、 論文とかは翻訳にあたってのコツはいちいち使えませんよね。 そこで、Google翻訳ツールセットを用い、おかしな翻訳は ユーザーが手作業で修正する。それと同じ。
68 :名無しさん@お腹いっぱい。 :2015/05/17(日) 21:46:03.08 ID:tp97P1Sy.net パナソニックの体験版ずっと前に使ったらしく テスト出来なかったので とりあえず体験版で上手くいったんでe.Typist NEO買っちゃった。 パナのばか野郎 ちゃんと段落指定しないと文字間にスペースが入ったりするからめんどくさいけど ルビもしっかり読み取るし 右クリックですぐ検索できて素敵なPDFライフ送ってます スキャンしたjpgファイルのゴミの山が宝の山に化けたぞ!
69 :名無しさん@お腹いっぱい。 :2015/11/11(水) 15:39:24.99 ID:CAbtX60K.net 2010年購入image scanner CanoScan 5600F付属の読取革命Lite v.1.09。 Web pageにあるJPEGなどの画像表示、つまりそのままテキスト文でcopy&paste できないものをテキストデータに変換したい時がたまにある。 画面キャプチャ(snipping tool)によるclip boardを入力データとして読み 込んで、文字認識させてテキスト文にする。 最近5年ほどでOCR softwareの文字認識能力が格段に向上したというけど、 私の使っているものは読み間違えが多い。 画数の多い漢字は正確に認識しにくいが、英字などで"i"&"l"&"1", "o"&"0" などは必ず間違っている。
70 :名無しさん@お腹いっぱい。 :2016/01/19(火) 15:11:19.09 ID:mq3Mk8xh.net etypistがえらい勢いで良くなってるな 読取はルビ読み取れないが eは読む
71 :名無しさん@お腹いっぱい。 :2016/02/02(火) 12:46:48.20 ID:8rKEDg16.net etypist15の発売日2013年やないか
72 :名無しさん@お腹いっぱい。 :2016/04/06(水) 20:44:12.53 ID:0vG9P8H4.net ☆ 日本の核武装は早急に必須です。☆ 総務省の、『憲法改正国民投票法』、でググってみてください。 日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である 改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
73 :名無しさん@お腹いっぱい。 :2016/07/29(金) 17:23:08.48 ID:chwtCP1b.net etypist、性能はいいんだが 読み込み時にいちいちウインドウがアクティブになるので 他の作業が出来なくなるのがうざい 別にアクティブになる必要ないだろ
74 :名無しさん@お腹いっぱい。 :2016/08/02(火) 21:34:27.65 ID:xQSe+qqJ.net OCRソフトで、原稿のフォントを指定すると 認識精度が上がる機能があればいいのにな ゴシックと明朝、フトコロの大小だけでも だいぶ精度が上がりそうなのに
75 :名無しさん@お腹いっぱい。 :2016/08/13(土) 09:58:07.95 ID:cdpMErTk.net 活字なら文字の大きさも一定だし、フォントとか認識できれば、言偏が分解されたりせずに済みそうだよね
76 :名無しさん@お腹いっぱい。 :2016/09/22(木) 00:19:47.24 ID:ZZVNIQT0.net 認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた https://bita.jp/dml/reactive_int
77 :名無しさん@お腹いっぱい。 :2016/10/06(木) 14:45:13.21 ID:skZ2qPPb.net 体験版で精度をチェックしたいのに製品版と性能が違うのもあるらしいから困る
78 :名無しさん@お腹いっぱい。 :2016/10/07(金) 09:30:18.61 ID:jp9s72R4.net FineReader買ったけどいいね。
79 :名無しさん@お腹いっぱい。 :2016/10/07(金) 23:42:03.50 ID:F621ToTQ.net >>78 学習が日本語対応してないのが痛い
80 :名無しさん@お腹いっぱい。 :2016/10/10(月) 07:22:47.51 ID:xE3A06X4.net >>79 実質、英文のOCR専用でしょう 日本のOCRソフトで英文OCRやってもグダグダなのと同じだと思う 洋書を電子化するにはなかなか良いソフトだと思う
81 :名無しさん@お腹いっぱい。 :2016/10/10(月) 13:04:37.24 ID:MNrX4hom.net ホームページ見ると英語なら読取革命もABBYY社製エンジンだね ちなみにe.typistはNuance社製
82 :79 :2016/10/11(火) 01:30:01.21 ID:eksnS3tm.net >>81 俺はhttp://monomania.sblo.jp/article/55737163.html で↓を読んでFineReaderを買うことにした。 >>読取革命は英語の部分はFine Readerという英語圏では最も信頼性が高いOCRを採用していますが、エンジンを上手く生かし切れていません。
83 :名無しさん@お腹いっぱい。 :2017/07/08(土) 18:41:50.55 ID:xQlgvdQ3.net eTypistは認識中にウィンドウがアクティブになるのを防げんのかね
84 :名無しさん@お腹いっぱい。 :2017/07/09(日) 16:06:20.21 ID:iESi7AYh.net >>83 確かに。読取革命とは対照的に、処理中はPCを 事実上専有されてしまい困るね。 googleのAPIを試してみたら、認識精度は相当良かった。 今は(たぶん)アプリがないので敷居は少し高いが、 将棋といい、今後はAIの方向性になっていくのかな。
85 :名無しさん@お腹いっぱい。 :2017/07/11(火) 00:20:04.02 ID:EO4izff5.net パナソニックがすでにAIとかディープラーニングを投入した手書き文字 対応の帳票OCRソフトを発売しています ttp://news.panasonic.com/jp/topics/148335.html お値段もいいっすね。 ・帳票OCR Ver.8 クライアント版:398,000円(税抜)
86 :名無しさん@お腹いっぱい。 :2017/07/12(水) 19:51:06.12 ID:yQE9Ft7A.net >>85 お値段張りますね。個人にはちょっと手が出ません。 個人的にはGoogle cloud visionで満足ですが、 誤認識のフィードバックや学習機能はないですね。
87 :名無しさん@お腹いっぱい。 :2017/08/20(日) 10:04:39.07 ID:2KZZB/L/.net Google Cloud Vision OCR使って検索可能なpdf作るコマンド昔作ったけど、Googleがjsonの形式変えて後ろに余計なものつけたせいで使えなくなったw 直したいけどヒマないな… https://github.com/dinosauria123/gcv2hocr Linux用。Bash on Windowsでも使える。
88 :名無しさん@お腹いっぱい。 :2017/08/24(木) 19:50:24.14 ID:m5h5ZsxQ.net >>87 素のWindows環境なので試せませんが、 検索可能PDFはいい考えですね。 高級言語を何も知らないので、標準のPowershellで フロントエンド部分のスクリプトを作ってみたら、 Google Cloud Vision、結構いいかも。 文庫本一冊あたり数分でテキスト化できるようになった。
89 :名無しさん@お腹いっぱい。 :2017/08/24(木) 20:11:01.05 ID:mY06hxQc.net Google Cloud VisonのOCR, いいですよね。 古いカメラ好きで、戦前戦中期のカメラ広告のデータベースを作ろうとしてるのですが、 他のOCRよりかなり良くて重宝してます。 全てが読めるわけではないですが、ものによっては広告の見出しのロゴなども読み取れます。 ちなみにテスト中のサーバーはこちらです。 縦書きがひっくり返ったり、画像が出なかったりとまだうまくいかないのですがw http://104.197.98.173/ スクリプトは公開されますか?興味ありますw
90 :名無しさん@お腹いっぱい。 :2017/08/24(木) 20:51:11.80 ID:mY06hxQc.net Google Cloud Visionを使ったOCRソフトが1480円だそうです。いいかも。 http://n.shop.vector.co.jp/service/catalogue/ppocr/
91 :名無しさん@お腹いっぱい。 :2017/08/24(木) 21:10:00.64 ID:mY06hxQc.net すまん、これTesseractベースらしいw
92 :名無しさん@お腹いっぱい。 :2017/09/21(木) 15:18:37.11 ID:oeq2WaFN.net Googleドライブのサービスが終わることが決まったらしい てことはOCR民に重宝されていたGoogleドライブを経由して上げたjpgから文字化するあのシステムも失われてしまうのだろうか
93 :名無しさん@お腹いっぱい。 :2017/09/21(木) 15:29:09.54 ID:oeq2WaFN.net と思ったけど機能発展かなんかの流れで推移して仕組みが変わるだけでそういったシステムが無くなるわけではないのかな よくわからんね
94 :名無しさん@お腹いっぱい。 :2017/09/26(火) 18:13:31.59 ID:L30pb7J/.net 手書きOCRの記事をよく読むけど、手書きであの精度がでるなら、活字は100%近い精度が得られそうな気がするけど、どうなんだろうね?
95 :名無しさん@お腹いっぱい。 :2017/09/27(水) 16:30:29.45 ID:kyhjOBdx.net 記事のための
96 :名無しさん@お腹いっぱい。 :2017/12/30(土) 01:13:36.18 ID:vWdc5/Pn.net ☆ 私たち日本人の、日本国憲法を改正しましょう。現在、 衆議員と参議院の両院で、改憲議員が3分の2を超えております。 『憲法改正国民投票法』、でググってみてください。国会の発議は すでに可能です。平和は勝ち取るものです。お願い致します。☆☆
97 :名無しさん@お腹いっぱい。 :2018/01/12(金) 08:46:36.99 ID:OG0vqAvx.net 電子書籍のように無料で稼げる方法 グーグル検索⇒『稲本のメツイオウレフフレゼ Z9GSY
98 :名無しさん@お腹いっぱい。 :2018/02/28(水) 23:51:50.98 ID:pigZ9q4r.net Google Cloud Vision APIで透明テキストのPDF作ってみたんだけど、abbyy finereaderとか、e-typist、読み取り革命とか、捨ててもいいレベルですね。 何万も掛けて買って、精度の悪さにがっかりしていたのがバカバカしくなるレベル。 Google Cloud Vision APIのOCRはマジでおすすめ。
99 :名無しさん@お腹いっぱい。 :2018/05/29(火) 15:55:16.34 ID:20k4ukZr.net IDSP8
100 :名無しさん@お腹いっぱい。 :2018/09/30(日) 02:03:47.28 ID:7yJ8ed3M.net https://imgur.com/7FjSs7h.jpg
101 :名無しさん@お腹いっぱい。 :2019/04/22(月) 13:32:08.24 ID:S+OQcRwJ.net LINEの新機能がOCR機能を搭載してたようだよ(現在PC版とAndroid版のみの機能) Googleやtesseractと比べてどうなのかな? こうなるとLINEの友達にOCR変換投げつけ用アカウントの人をどこかで用意しなきゃならん
102 :名無しさん@お腹いっぱい。 :2022/12/18(日) 21:05:23.59 ID:WQH1nNN9.net いちおう保守。
103 :名無しさん@お腹いっぱい。 :2023/08/02(水) 23:08:57.76 ID:xN5NT3mHq また岸田異次元増税憲法ガン無視地球破壊軍国主義文雄が今度は中東にまで丿コノコ莫大な温室効果カ゛スまき散らしながら世界中にハ゛力晒して しかもと゛の囗て゛脱炭素た゛のとほさ゛いてやか゛んだか.力による━方的な現状変更によって都心まで数珠つなぎて゛鉄道のЗ○倍以上もの莫大な温室 効果カ゛スまき散らすクソ航空機倍増させて気侯変動させて世界中て゛土砂崩れに洪水.暴風、猛暑、干は゛つにと災害連発させて核攻撃の何倍もの 人的物的被害を与えてるクソテロリス├が□シア非難とか笑わせんのもいい加減にしとけや.氣侯変動による世界の難民の数は1億人を超えて いるわけた゛か゛.日本でも洪水やクソ航空騒音によって住む場所を追われる被害者た゛らけ.豪雨やら灼熱地獄によって被害を受けた連中は被災者 て゛はなく、テロ政府による人為的なテロによって破壊され殺されたんた゛といい加減理解して立ち上か゛れよな、被災者支援た゛のと白々しい増税と 利権のネ夕にされて生命と財産を奪われるマソ゛体質マジキモチワ儿イぞ.プ―チンや金正恩は.このデ夕ラメジェノサヰト゛プ□パガンダテ囗 國家の本質を追求して正当性をアピ━ルすれは゛,世界的な惡者は曰本に原爆落とした世界最惡のならず者国家とその‐味た゛と八ッキリするた゛ろ 創価学會員は.何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最惡の殺人腐敗組織公明党を 池田センセ─か゛口をきけて容認するとか本気で思ってるとしたら侮辱にもほと゛があるぞ! hTТps://i,imgur.соm/hnli1ga.jpeg
30 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★
本文 スレッドタイトル 投稿者