開発 いらすとや。 24時間で漫画みたいにニュースを読めるアプリを開発した話

いらすとや風のイラストを作る by PowerPoint & Illustrator

開発 いらすとや

2019年11月19日 08時00分 「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 by 日本の古典籍や古文書で用いられている「 」を現代日本語の文字に変換する作業を「 」と呼びます。 多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。 そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。 の博士課程で機械学習の研究を行う 氏が、くずし字の活字化を取り巻く事情をまとめています。 How Machine Learning Can Help Unlock the World of Ancient Japan 過去の人々が残した膨大な書物や文書は、歴史や文化を考える上で非常に重要な資料となります。 しかし、言語や記法は時間と共に変化していくものであり、古い文書の多くは一部の専門家以外には理解できない状態になっています。 たとえば古代メソポタミア周辺で文字を記すために用いられた粘土板には、主に によって文字が刻まれていますが、これを解読できるのは特別な訓練を受けた一部の研究者だけです。 これと同様のことが、日本のくずし字においても起こっているとラム氏は指摘。 くずし字はおおむね9世紀から明治ごろまで使用されてきましたが、現代の教育課程には含まれず、日本人の圧倒的多数はくずし字を読めません。 その一方で、くずし字によって記された書物の量は膨大であり、手紙や個人の日記まで含めると、実に10億ページを超える文章が存在すると推定されています。 くずし字を理解できる人がほとんどいないため、くずし字で記された膨大な情報を読み解くには非常に長い時間と多くの資金が必要となります。 日本文化におけるくずし字の重要性を考えると、くずし字を認識するためにコンピューターを利用することは重要だとのこと。 by 以前から機械学習を用いたくずし字認識AIの開発は模索されていましたが、高クオリティのくずし字データベースが不足しているといった問題から、なかなか高いパフォーマンスが達成できませんでした。 そこで、 は によって精選されたくずし字データセットを作成し、。 データセットは更新を重ね、2019年11月11日のアップデート時点で4328の文字種と100万点を超える文字画像が用意されています。 包括的な高品質データセットの提供は、くずし字認識AIの開発に大きく寄与しました。 それでもなお、ラム氏はコンピューターによるくずし字の認識が困難なものであると指摘。 「一部の文字は文脈に依存した方法で記述されているケースもある」「文字の種類が4000種類を超えるため、データセットの中で数回または1回しか登場しない文字も多数ある」「現代では1つのひらがなで表される文字でも、 によって複数の文字タイプを持つ」といった問題や…… 「くずし字のテキストは時にイラストや背景と共に書かれており、テキストとイラストを区別しにくい場合もある」「個人の手紙や句などでは、 といった行や文字の大きさを統一しないで書く記法も存在しており、必ずしも『右から左に読む』といった順序が定まらない場合もある」などの問題が、くずし字認識AIの開発に立ちはだかっているそうです。 そんな中、ラム氏は人文学オープンデータ共同利用センターの研究者であるTarin Clanuwat氏や 氏らと共同で、 というくずし字認識モデルを開発しました。 KuroNetは文字の依存関係をとらえ、テキストのページ全体を一緒に処理するというアイデアに基づいています。 KuroNetは1ページあたりなんと1. 2秒ものスピードで全体を活字に直すことができるそうで、特に17世紀~19世紀の活版印刷書籍において高いパフォーマンスを発揮するとのこと。 もっとも、書籍間でパフォーマンスには大きな差が存在するそうで、多くの特殊な文字を含む辞書や、イラストが多くレイアウトも特殊な料理本においては、パフォーマンスが特に低いという結果になりました。 KuroNetでは、以下のようにくずし字をそれぞれ現代の活字に直すことが可能となります。 なお、あくまでも記事作成時点ではくずし字を現代の活字に直すだけであり、現代語に翻訳する作業は人間が行う必要があります。 KuroNetは開発された時点で最先端の結果を達成しましたが、くずし字を活字化するAI開発の分野をさらに刺激するため、 というプラットフォームにおいて、「数千枚の画像に書かれたくずし字をどれだけ正確に認識できるか」を競うコンペも開催されました。 最終的に293チームが参加したコンペでは、なんと95%もの精度を達成したチームも現れました。 同じ設定でKuroNetを調査したところ精度は90%で、順位的には全体の12位だったことから、KuroNetを上回る精度のAIが多数開発されたことになります。 今回の結果から、既存のオブジェクト検出アルゴリズムの一部は、そのままくずし字認識においてうまく機能するケースが確認されるなど、いくつかの重要な教訓が学べたとラム氏は述べています。 人文学オープンデータ共同利用センターが行ったデータセット作成により、くずし字を活字化するAIの開発は大幅に進歩したものの、依然として未解決の問題は多いとラム氏は指摘。 たとえば、訓練データの多くが17世紀~19世紀の書物から選ばれていますが、くずし字の歴史はもっと長く、手書きの文書もあれば印刷されたものもあります。 また、書籍の題名など一部のスタイルには非常に珍しいスタイルが使われていることも多いほか、石に彫られたくずし字ではまた違った形になる場合もあるとのこと。 そして、さらに魅力的な未解決の問題は、活字にされた文章をさらに現代語に翻訳するAIの開発です。 くずし字が古文の状態になるだけでも、現代人にとって読みやすさが大幅に向上するのは確かですが、それでも単語や文法の違いは大きいもの。 AIによって解読だけでなく翻訳も可能となれば、古典籍研究の上で大きな進歩となります。 これらの問題を解決するためには、歴史的文書を調査する研究者や機械学習の研究者などが双方の知識を組み合わせる、学際的な取り組みが必要だとラム氏は主張しました。

次の

[B! いらすとや] timetrainのブックマーク

開発 いらすとや

2019年11月19日 08時00分 「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 by 日本の古典籍や古文書で用いられている「 」を現代日本語の文字に変換する作業を「 」と呼びます。 多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。 そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。 の博士課程で機械学習の研究を行う 氏が、くずし字の活字化を取り巻く事情をまとめています。 How Machine Learning Can Help Unlock the World of Ancient Japan 過去の人々が残した膨大な書物や文書は、歴史や文化を考える上で非常に重要な資料となります。 しかし、言語や記法は時間と共に変化していくものであり、古い文書の多くは一部の専門家以外には理解できない状態になっています。 たとえば古代メソポタミア周辺で文字を記すために用いられた粘土板には、主に によって文字が刻まれていますが、これを解読できるのは特別な訓練を受けた一部の研究者だけです。 これと同様のことが、日本のくずし字においても起こっているとラム氏は指摘。 くずし字はおおむね9世紀から明治ごろまで使用されてきましたが、現代の教育課程には含まれず、日本人の圧倒的多数はくずし字を読めません。 その一方で、くずし字によって記された書物の量は膨大であり、手紙や個人の日記まで含めると、実に10億ページを超える文章が存在すると推定されています。 くずし字を理解できる人がほとんどいないため、くずし字で記された膨大な情報を読み解くには非常に長い時間と多くの資金が必要となります。 日本文化におけるくずし字の重要性を考えると、くずし字を認識するためにコンピューターを利用することは重要だとのこと。 by 以前から機械学習を用いたくずし字認識AIの開発は模索されていましたが、高クオリティのくずし字データベースが不足しているといった問題から、なかなか高いパフォーマンスが達成できませんでした。 そこで、 は によって精選されたくずし字データセットを作成し、。 データセットは更新を重ね、2019年11月11日のアップデート時点で4328の文字種と100万点を超える文字画像が用意されています。 包括的な高品質データセットの提供は、くずし字認識AIの開発に大きく寄与しました。 それでもなお、ラム氏はコンピューターによるくずし字の認識が困難なものであると指摘。 「一部の文字は文脈に依存した方法で記述されているケースもある」「文字の種類が4000種類を超えるため、データセットの中で数回または1回しか登場しない文字も多数ある」「現代では1つのひらがなで表される文字でも、 によって複数の文字タイプを持つ」といった問題や…… 「くずし字のテキストは時にイラストや背景と共に書かれており、テキストとイラストを区別しにくい場合もある」「個人の手紙や句などでは、 といった行や文字の大きさを統一しないで書く記法も存在しており、必ずしも『右から左に読む』といった順序が定まらない場合もある」などの問題が、くずし字認識AIの開発に立ちはだかっているそうです。 そんな中、ラム氏は人文学オープンデータ共同利用センターの研究者であるTarin Clanuwat氏や 氏らと共同で、 というくずし字認識モデルを開発しました。 KuroNetは文字の依存関係をとらえ、テキストのページ全体を一緒に処理するというアイデアに基づいています。 KuroNetは1ページあたりなんと1. 2秒ものスピードで全体を活字に直すことができるそうで、特に17世紀~19世紀の活版印刷書籍において高いパフォーマンスを発揮するとのこと。 もっとも、書籍間でパフォーマンスには大きな差が存在するそうで、多くの特殊な文字を含む辞書や、イラストが多くレイアウトも特殊な料理本においては、パフォーマンスが特に低いという結果になりました。 KuroNetでは、以下のようにくずし字をそれぞれ現代の活字に直すことが可能となります。 なお、あくまでも記事作成時点ではくずし字を現代の活字に直すだけであり、現代語に翻訳する作業は人間が行う必要があります。 KuroNetは開発された時点で最先端の結果を達成しましたが、くずし字を活字化するAI開発の分野をさらに刺激するため、 というプラットフォームにおいて、「数千枚の画像に書かれたくずし字をどれだけ正確に認識できるか」を競うコンペも開催されました。 最終的に293チームが参加したコンペでは、なんと95%もの精度を達成したチームも現れました。 同じ設定でKuroNetを調査したところ精度は90%で、順位的には全体の12位だったことから、KuroNetを上回る精度のAIが多数開発されたことになります。 今回の結果から、既存のオブジェクト検出アルゴリズムの一部は、そのままくずし字認識においてうまく機能するケースが確認されるなど、いくつかの重要な教訓が学べたとラム氏は述べています。 人文学オープンデータ共同利用センターが行ったデータセット作成により、くずし字を活字化するAIの開発は大幅に進歩したものの、依然として未解決の問題は多いとラム氏は指摘。 たとえば、訓練データの多くが17世紀~19世紀の書物から選ばれていますが、くずし字の歴史はもっと長く、手書きの文書もあれば印刷されたものもあります。 また、書籍の題名など一部のスタイルには非常に珍しいスタイルが使われていることも多いほか、石に彫られたくずし字ではまた違った形になる場合もあるとのこと。 そして、さらに魅力的な未解決の問題は、活字にされた文章をさらに現代語に翻訳するAIの開発です。 くずし字が古文の状態になるだけでも、現代人にとって読みやすさが大幅に向上するのは確かですが、それでも単語や文法の違いは大きいもの。 AIによって解読だけでなく翻訳も可能となれば、古典籍研究の上で大きな進歩となります。 これらの問題を解決するためには、歴史的文書を調査する研究者や機械学習の研究者などが双方の知識を組み合わせる、学際的な取り組みが必要だとラム氏は主張しました。

次の

[B! いらすとや] turu_craneのブックマーク

開発 いらすとや

いらすとや ペイメント 「冷やし中華始めました」のイラスト、 この他にも、リクエストも含め、様々な種類のイラストを用意されており、なかなか見つからなさそうだったり、ごく一部に需要があるのだろうな、という画像もいらすとやには存在します。 例えばこちら・・・・ 研究者から高額な掲載料を受け取り査読をしていない論文を出版するハゲタカ出版社(捕食出版社)のイメージのイラストです このように、膨大なイラストがいらすとやさんに揃っています。 店頭のポスター、チラシ、あるいは官公庁や学校などの配布物などで、よく見かける存在になり、 絵をみただけで「あ、いらすとやさんだ!」と想起される存在になりました。 もう一つ、いらすとやがここまで活用されている理由として、利用条件と「いらすとや」というストレートなネーミングの覚えやすさが強く活きていると思います。 いらすとやの利用規約では、個人利用は原則無料、商用利用は1つの制作物につき20点まで無料としています。 特に官公庁・学校・企業にとっては、イラストや写真の利用に関して、有料であれば稟議を挙げる必要があるケースも多いので、いらすとやさんの素材だと、気軽に利用させていただきやすいという点があります。 このように、コンテンツやちらしにイラストを入れたいというニーズに対して、非常に利用者に配慮した利用規約が設定されているというのも、いらすとやの普及、バイネーム検索を押し上げた理由といえましょう。 ホームページに関しても、宣伝以外の有益なコンテンツが追加され、無料で閲覧できるサイトについては、1ページごとに20点の使用を許可するなど、web製作担当者、チラシ・広報誌担当者などにとって使いやすい利用条件となっています。 商用のページであっても、宣伝以外のユーザーにとって有益なオリジナルのコンテンツが追加され続けるサイトの場合は、1ページごとに20点までご利用いただけます。 ただし無料で閲覧できるオープンなサイトに限ります。 前述の要素に加え、作者であるみふねたかしさんの地道かつ大量なイラストの積み重ねもあって、多くの人の間に、「この絵よく見るね」とか、「あ、いらすとや!」という想起がなされるようになったのではないかと思います。 転職アンテナのmotoさん 次に、バイネーム検索される存在として挙げられるのは、というwebサイトを運営したり、最近は「」という書籍を出版された「」です。 motoさんはtwitterを利用し、 転職に特化した情報を提供することで、フォロワーを6万5千人まで増やし、かつ需要が現在増している転職市場や副業に関わる情報を出すことで、検索キーワードで固有名詞で検索される存在になっています。 僕は第一想起される存在になるために、自分が得意とする分野の「専門家」としてユーザーから「指名される状態」を目指したのです。 というように、 「想起される存在」であるために、twitterなどのメディアを使って情報発信をされ続けています。 また、書籍内でも、 副業を行うのであれば本業と相乗効果があるものを行う、まずは本業にフルコミットする、逃げの安易な転職を勧めない、地道な努力の蓄積や体験が必要、(炎上などではなく)共感でファンをつくるなど、甘い言葉ではなく正直な言葉、地道な積み重ねなど、現実的な提言をされています。 タイトル・コンテンツとも、非常に考えられた内容で、 信長の野望の全国版や三國志のファミコン時代からはまっていた記事作成者としては、わかるなー、と感じ、また、武将の配置を、セオリー通りではなく子ども自身に考えさせたこと、米相場を需要と供給と結びつけるなど、ゲームと学びをリンクさせた記事。 他者を変えることより、人間の本性は変わらないという前提のマネジメントで、よくできることをさらに強化した方が成果につながること、P. Fドラッカーのマネジメント論をもとに、仕事の環境や場所、地位など適材適所を見極めることの大切さを述べています。 よく使われがちな「至急」という言葉にあえて上記のような表記をし、本来の「至急」を使うべき局面を提示、安易に利用すべきではないということ、「至急」は立場の上下の要素、役職や立場に関する勘違いを助長しやすい点を挙げています。 このように、検索エンジンで特定のキーワードを狙うのではなく、 専門性をもつ複数の著者の方々の体験・言葉を踏まえ、読者に考えさせる、読ませる記事を提供することによって、「に行けば独自の視点を持つ記事が閲覧できる」というブランドイメージを確立しています。 そしてその強みを言語化し、外部に出していく。 これがブランド構築につながる一歩ではないかと思います。

次の