日本語配列の効率と思考スピード

「出来のいい日本語配列をある程度習熟すると思考スピードのほうが実用上足かせになる」ということを思いついて、ツイッターで垂れ流してたものをまとめてみました。

 

 

 

 

 

 

 

 

 

 

 

 

 最近はツイッターをあんまり使ってなくて、ましてやこんな配列関係のことをやってる時は殆どなかったと思いながら書いてます。

 

  つぐみ配列、作って使って11ヶ月位立ちましたが、手に馴染んですごいです。自分のために作った配列なので当然といえば当然ですが、やっぱり結構いい線いってるんじゃないかなと思ったり。

 

自分で作るまで行かなくても、ローマ字入力で不満があるなんてときはマイナー配列とか、調べてみるといいかもしれません。

読みやすい文章の文字数?

もう冬です。前回更新が10月前くらいだったので1ヶ月半くらい立ってます。ブログ書きましょう。

 

  さて、私はブログ書いてる時に文字数をカウントしていて、大体1000文字以上になるように意識しています。特にこれといった理由はなく、SEO的には最 低そのくらいあったほうがいいという話を聞いただけです。しかしある時文字数について考えてみたら、あれ1000文字もいらないんじゃないかと思い始めま した。


何故か私はキーボード で文章を書くときは(特にメカニカルキーボードで書いてる時とか)少なくとも500文字くらいは書けるんですが、紙とペンで書くとまあまあダメで、キー ボードで書く時と同じ内容でも原稿用紙1枚行かないくらいになってしまいます。ノートとかに手書きで書いて結構書いたと思ってもだいたい600文字くらい になるんです。


 通常のブログの平均 的な文字数はどのくらいなのかわかりませんが、1000文字は原稿用紙2枚半、2000文字は原稿用紙4枚と考えてみると、結構な文字数ありますよね。何 か専門的な記事かもしくは好きなブロガーでもなければそこまで文字数いらないんじゃないかと思います。


なにせ暇つぶしを兼ねることもあるブラウジングの中で、原稿用紙数枚に相当する量の文章を気軽に読むのは……ちょっと本格的に調べようと思っている人には通じるかもしれないけど暇つぶしで読む気にはならないかな、という感じだと思います。


 こう考えるきっかけはちょっと長い記事があるなと思って文字数測ってみたら1200文字くらいで、ありゃそんなに長くなくねと思ったことからです。
 

なんか個人的には文字数増やして(というか中身を増やして)書こうとする筆者と、あっさり読みたくなる読者としての違いなんてのもあるのかな、と思います。


 じゃどういうくらい がいいのか……というと読む人によるという結論に至るしかないのですがね。必要な情報を求める時しかこういう記事を覗かない、ディープな情報がほしい、と いう人が来るような記事はそれだけ内容をこく(文字数を多く)しなければならないでしょうし、軽く暇つぶしなどに気軽に読める記事を書きたいという時は あっさりとした感じでいいと思います。


このブログの場合は(配列関係などのことはともかく)基本あまり内容が濃くないので、あっさりした、少なめの文字数のほうが読みやすいのかな……と思います。

 

 というこの記事の文字数は約1000文字です。ありがとうございました。

 

MacとWindowsとLinux(Ubuntu)について思うこと

珍しくなにか書く気になったので書きます。 

 

 

世の中には様々なOSが存在しますが、今回はその中でもそれなりにメジャーなMacWindows.Linux(主にUbuntu)について書こうと思います。 

 

 


まずはWindowsから行きましょう。 

 

WindowsはPC用OSとしてもっとも普及していると思われます。

 

個人的にはあまり好きではないのですが、その利点として、最も普及しているので、人に聞きやすいということがあります。

あとソフトがいっぱいある(特にゲーム)。 

利点はこのくらいかと。 

 

短所はいっぱいある気がする。

 

起動時間

初めは早いが使っていくと重くなる

軽さ

上に同じ

使い勝手

不十分ではないが使いやすくはない

将来性

マイクロソフト次第。オープンソースではない。

ざっくり書いてみましたがコレだけではない気がする。 

あとWindowsはOSとして欠陥があるていう話も聞きますな。 

 

 

次。Mac。 使ったことはないですが、思うことなどを。 

 

利点は、これがUNIXということ。あとブランド。 UNIXというだけでかなりの利点があります。 あとはアップルというブランドと安心感が物凄くあります。 

 

短所としては、非オープンでアップルという1つの会社によって生かされも殺されもする独占的なところかなと思います。そこが嫌いでねあまり使いたくないんですよ。 

ハードは最高に近いと思いますけどねえ。 

 

 

最後、LinuxというかUbuntuについて! 

 

いいですよかなり 。 利点書き出します。

 

起動時間

早い

カスタマイズ性

かなりある

安定性

結構ある

将来性

オープンソースで会社が支援

安全性

ウイルスなどが殆ど無い

などなど。

Ubuntuは本当に誰にとっても使いやすいOSを目指しているので、このような感じになっています。 

 

短所としては、あまりユーザーがいないことくらい。でも今はインターネットというものがあります。

 

 

個人的に使いたい順に並べてみると、 Linux(Ubuntu)>Mac>Windows というような感じになります。

それぞれ向き不向きというものもある気がしますが、個人的にはLinuxがこの中で一番いいOSだと思ってます。 

 

(個人の感想です) 

 

 

 

 

Author: hiroyasu

 

Created: 2015-11-11 水 21:04

 

Emacs 24.5.1 (Org mode 8.2.10)

 

紙のアナログ回帰とデータのデジタル管理

  9月も過ぎ、あっという間に秋になっていく、そんな中夏のはじめから更新していなかった、やっと書くよh2tです。

 

 夏、終わりつつあります。残暑もずいぶん収まり、夜も長くなってきました。あっという間に秋。

夏の間、私は何をしていたかというと、アナログに目覚め始めました。というかデジタルから離れて行きました。

 

アナログ回帰しつつある

アナログ回帰、どういうことかというと、つまり紙に戻ったのです。

具体的には、パソコン上のEmacsでとっていたメモは「情報カード」に、Emacs上のOrg-modeで管理していた日記やアイデアは「ノート」や「情報カード」になりました。

 

 なんでEmacsから離れたか、なんでスマホなどを使わず紙というアナログな方法に戻ったのか。

簡単です。それは「楽」だから。

 

 私は常時スマートフォンを持ち運ぶわけではないし、ましてやEmacsを使って一日中パソコンの前に入るわけではない。そんな簡単なことがきっかけになりました。

 

 100均で見つけた「情報カード」というものの活用法を調べていたら、PoICというライフハック的メモ術に行き着き、そこからだんだんとデジタルで管理していた物を、アナログへ移していったのです。

 

デジタルじゃだめなの?

  じゃあデジタルに不満はなかったの?と聞かれると、はい、ほとんどありませんでしたと答えるほかありません。Emacsのスケジュール管理やorg- modeの管理のしやすさは文句ありませんし、すぐにパソコンをサワれる時なら非常に便利です。見やすいし、変更もしやすい。

 

 でも、私は24時間睡眠時間と食事以外パソコンの前に座っているような人ではありませんし、歩きもすれば出掛けもします。スマートフォンフリック入力使いづらい。そう思うからアナログに回帰しているわけです。

 

結局はどっちでもいい

 いま仕事でパソコン使ってて、ほとんどの時間はパソコンの前にいる、という場合や、スマートフォンタブレットで時間や生活を管理したりするのに抵抗がない、という場合はデジタルは便利でしょう。というかデジタルのほうが便利です。

 しかし、私は思いの外デジタルと離れていた。ただそれだけです。でも、一度入ると沼ですよ。

  やはりパソコンやスマートフォンなどと離れない生活をしているならデジタルのほうが確実に便利です。しかし、アナログでも大抵のことはできるし、可搬性はアナログのほうが高い。

たまには、アナログ方式を見なおしてみませんか?

 

漢字直接入力は何なのか。もしくは漢直おすすめという話。

 世の中物好きというのはいるものです。シャープペンシル全盛の時代に鉛筆を使ったり、Windowsがシェア9割を占めている時にわざわざシェア2%満たないほどのLinuxに移ったりしている人が。誰か。ええ私です。

 

 そんな私が開発したつぐみ配列には「漢字直接入力」(俗に言う漢直)が搭載されています。

 

  定義しましょう。ここでいう漢直とは、変換なしで漢字とかなを打ち分けることができることができる配列です。例えば漢字変換を利用した打ち分け(例えば、 「かん1」で変換すると「漢」が出力され、「かん2」変換で「間」が出力されたりするようなもの)は今回話題にしません。あまりつかったことないので。

 

 さて、その漢直ですが、その主な特徴に「日本語入力が楽になる」ということが挙げられます。

 

 これどう言うことかというと、一般的にタイピングの速度を早めたりするのはカナ系配列(JIS仮名、月配列、親指シフトなど)が用いられますが、ああいうのはあくまで変換ありきで作られているのですよ。

 

 ああいう配列は、かなしか入力できない。どうやっても今の漢字が多数存在している日本語文において、変換なしで入力することは不可能に等しいのです。

 

 だからこそ、かな系の配列は変換にかかる時間も視野に入れて、その文を「かなのみで」書いた時に最速となるように設計されているのがほとんどです。言うなれば、キーボードからの入力が「話すこと」に近づく配列群と言いましょうか。

 

 対して漢直、これは「文」を「書く」ことに特化した配列です。紙にペンで文章を書いていくのと同じように、画面にキーボードで「文」を「書く」ことができるのです。

 

 例を上げましょう。以下の文を漢字かな交じり分で入力してみてください。

 

「記者が貴社に汽車で帰社した」

 

かなに直してみましょう。

 

「きしゃがきしゃにきしゃできしゃした」

 

このかな文字列を、1度で完全に変換しきれたでしょうか?私の環境では無理でした。

 

 しかし、この文字列、紙にペンで書くときににいちいち、ひらがなで書いてそこを消して漢字に直していくでしょうか。しませんよね。漢直というのは文字の完全な打ち分けができますから、この紙にペンで書く感覚をいとも容易く再現できるのです。

 

 もちろんデメリットもあります。打ち分けができるということはそれだけ覚えなくてはいけないということ。多いものだと約3000個でしょうか。

 

しかし、それを抜ければキーボードでストレスのない、純粋な「書く」感覚を手に入れることができるのです。漢直のメリットはそこです。打鍵数が減るとか、打ち分けができるというのは全てそのためなのです。

 

 さて、漢字直接入力が使える配列は一体どのくらいあるのでしょう。以下に少し並べてみましょう。

  • T-Code ……元祖(無連想式)漢直。効率に特化したストイックなプロ向けな配列。
  • TUT-Code ……あまりにストイックなT-Codeをマイルドにして漢字数増やした配列。
  • G-Code ……覚えやすいT-Code、打ちやすいTUT-Codeを目指して作られた配列。
  • Phoenix ……打ちやすい、疲れない、覚えやすい漢直を目指して作られた配列。
  • つぐみ配列 ……私が開発した、書くことに近づける配列。

一例を上げてみました。他にもくぐってみてください。いろいろありますよ。

 

この記事を読んだ方、ぜひ、1度調べて、使ってみてください。世界が広がるかもしれませんよ。

[つぐみ配列開発記]つぐみ配列第一弾公開と漢直欲[#3]

 気付いたら前回の更新から1ヶ月経っててあせってるh2tです。前回の更新からつぐみ配列も色々変わりまして、今では濁音後付け版を試作していたりします。

 

 さて前回の続きです。ある程度つぐみ配列の原型も出来まして、さあ公開しようかという時の話と、唐突に出てきた漢直欲の話。

 

 つぐみ配列の形もある程度決まり、さあ公開しようかという時に、あるものを唐突に思い出してしまいました。

「そういえばこまどり配列に漢字を直接打てる定義あったよな……あれ使いこなせれば変換のストレスから開放されるんじゃね?」

こまどり配列には、いくつか変換なしで入力できる定義がありました。これは作者様のサイトに詳しいことが書いてあります。

 

こまどり配列の漢字入力部分などについての記事

 

そこから色々調べていくと、「漢直」なるものが私の考えていることを実現した配列群だということがわかりました。T-CodeとかTUT-CodeとかG-CodeとかPhoenixとかですね。

 

これがまたすごくて、この漢直というものに非常に憧れを抱いてしまいました。

 そこでまず、一度漢直部分を含まない仮名部分だけのつぐみ配列を公開して(確か当時はつぐみ配列Ver.1とか呼称してたと思う)、漢直をどうにかして搭載できないかと考えました。

どう考えても当時の私が3時間程度で立派な漢直を作るのは不可能なので、どこからか漢直部分を借りようかと。

シフトキーでシフトすればT-CodeやTUT-Codeなどを実装することはできるので、借りる漢直に悩みました。

 単純に1ストローク増えるので、できるだけストローク数は少ないほうがいい。

ストロークストロークもかかっていたらまともに入力できるわけがないと思い、候補に上がったのはT-Code。無連想式漢直の始祖に当たる配列です。搭 載している文字は2000文字弱、全て2ストロークで入力できる代わりに仮名でさえ無連想で入力しなければいけないストイックな配列です。

 かな部分の問題はつぐみ配列の仮名で解決できるので、あとは搭載するのみ。搭載したつぐみ配列は「つぐみ配列Ver2」とか言って公開しました。

  その後TwitterでのやりとりからT-Code側のかな定義を削除したり、カタカナも打てるようにしたりして、ここで初めて今のつぐみ配列のような、 「仮名」+「カタカナ」+「漢字」の3つが揃った配列が出来上がったわけです。ここまでで作り始めてから約2週間かな?

 今回はこれで終わります。次回は……そうですね、自作漢直部分の話でも書きましょうか。

 

[つぐみ配列開発記]「自作同時打鍵配列」案とGoogle日本語入力[#2]

 最近はいまいちネタもないしtwitterもあまり使ってないけど、意欲だけは有り余るh2tです。前回はつぐみ配列を作る動機までを記事にしました。今回は今のつぐみ配列ができるまでの過程を書きたいと思います。

 


 

 

 

前回の記事はこちらから。↓

[つぐみ配列開発記]私はなぜ配列を作るに至ったか。[#1]

 

 こまどり配列を同時打鍵化すると決まったはいいものの、実際のところどんなふうに実装するかはイマイチ決めかねていました。

 

というのも、私が使っているパソコンの環境は、有名ドコロで世界シェアの99バーセントを誇る「Mac」や「Windows」ではなく、残り1パーセント の「Linux」と呼ばれるもの、その中での60パーセント(つまり全体の0.6パーセント!)の「Ubuntu」です。

 

しかもそれは世界の話。「日本語入力」という、世界から見れば小さい島国のためにしか使われないソフトウェア、アブリケーションというのは非常に少ないのです。

 

 

 そんな環境である程度他の人も使える方法というのは、「Mozc」という、「Google日本語入力」のオープンソース版(辞書が公開できないので辞書 自体は平均的だが、他の部分はほぼMozcとGoogle日本語入力に変わりはない)しかありませんでした。

他にも「Anthy」などがあるのですが、 ローマ字テーブル(注1)が柔軟にカスタムでき、その上でWindowsMacでも動くものはMozcしかなかったのです。

 

 

(注1)……どの「キー」を打つとどの「文字」が出てくるか決めたファイル。定義ファイルとか言ったりもする。

 

 そんなことを頭の隅に入れながら、どういう仕組みにしてみようかなと思い、いろいろ考えてみたのが下の案2つです。

 

(1)何らかの方法で親指に文字キーを割り当て、3つのキーを同時打鍵でなんとか入力できるようにする。

 

(2)おとなしく五十音順に並べる。

 

 

 まず(1)について。同時打鍵にするならけっこう範囲狭くできるんじゃね? と思って考えたのがこれ。一応ある程度はねってたけど結局、Google日 本語入力で実現できそうになかったので諦めました。多分Windowsの「DvorakJ」とか使えば実装は出来るんでしょうけど、あいにく Windowsはさほど好きではないので。こんな感じの「Google日本語入力だとできない」案というのは結構ありました。

 

 

 (2)について。(1)を諦めたあとに、「初期のつばめ配列も五十音だったし、おとなしく並べてみるか」と開き直った時に実装したのがこの「五十音順」配列でした。以下のような感じです。

 

 

子濁

子濁

子濁

子濁

子濁

 

  純粋な五十音ではないのは、こまどり配列の名残。2段なのは結局、同時打鍵でストンと打てるような形にしたかったため。これがつぐみ配列の原型になります。

 

 ここまでで今のつぐみ配列の形はある程度出来ているのですが、配列の並べたものを使っていると、一応使えなくはないけど打ちづらいものがあったりします。そこを調整したのが今のつぐみ配列、というわけです。

 

 

次回はつぐみ配列第一弾公開の話と、ともなう唐突に出てきた「漢直」欲の話でも書こうかと。