Thu, Mar 18

  • 23:57  @syou6162 うは  [in reply to syou6162]
  • 23:54  検索回数は、平均クエリ内フレーズ数*各クエリの平均Nグラム数位になるな。何回叩けば気が済むんだ。
  • 23:53  Ngramのカウントはバイト単位ではなく文字単位でやらなきゃいけないな。日本語めんどくさいわ。
  • 23:53  動的に設定の書き換えをしながら検索をすると、デバッグが面倒になるな。動的に書き換えるのは止めることにしておこう。どうしても無理になるまでやらない。
  • 23:53  アブストをひたすら読むような時間がひつような気がする。
  • 23:52  文書番号のソートは、一番最後にやることにしようか、、、。マネギガで読んだ気がするけど、即使わなかったので忘れた。調べ直さねば。
  • 23:50  文書は結局あとから追加するし、そもそも数億件とか大量の文書がある場合に、最初から全ての文書番号をソートして保持するとかあり得ないな。
  • 23:50  直近のテーマは、大雑把にどーんとやる、である。どうせ最初は失敗するから簡単で良いのだ、と考えることにした。
  • 23:48  重複無くなった。とりあえず、テストindexに文書番号が入ったので、引っ張ってみるか。。。
  • 23:42  次は文書番号の重複を削除。
  • 23:41  なんか、思い通りにアップデートできないが、一旦消して上書きすると上手くいく。僕が書いてないコードだからなぁ。なにが起きてるんだろう。近いうちに丸々置き換える。
  • 22:35  最初はブーリアンなindexで良いや。
  • 22:23  あー、なおった。つぎへ。
  • 22:20  あああ、なんか想定通りにならないと思ったら、格納した文書が完全に化けとる。やりなおしか。。。
  • 19:34  文書の取り出しおわり。ちょっと酷いとこも修正。
  • 19:04  開発はもう、ずっと先まで進んでいて、次は格納済みの文書を取り出す処理を書く。
  • 19:02  なんか、順番に貼っているのだが、ここまでまとまって手元にあると、ブログ記事にしたくなるな。。。
  • 19:02  自分に関連していても、自分に不利益のないパフォーマンスには心を乱されないことに気がついた。
  • 19:01  だが、心が乱されないということは、パフォーマンスに心が乱されているのではなく、自分に関連することや、関係すると懸念できてしまうことに心を乱されているのか。。。
  • 19:01  隣の部屋から知らない単語が聞こえてくるが、パフォーマンスしている、ということは分かる。
  • 19:01  もっと他人を信用するか、信用できる他人の比率が飛躍的に多い環境に移動する必要がある気がしてきた。
  • 19:01  同じ状況に直面する他人を完全に信用できれば、あれこれ最悪な事態を考えて先回りして動く必要がなく、切り分けた部分問題に専念できるのでは。問題を分割できればできるほど非常に心が休まる。のかも。
  • 19:00  他人が何を言ってるのか分からなければ、他人の発言で良い方向に感情はぶれないが、悪い方にもぶれない。
  • 19:00  よくも悪くも、最近の生産性の悪さは、周囲の状況が分かってしまう程度に、自分のなかの語彙が整備されてしまっている事に起因していることが分かった。関係の無い場所に来てみると生産性が極めて向上する。
  • 18:59  ngramのnの値は複数を同時に与える場合があるので、外からNを与えるときには、Nのリストを与えた方がいいのか。で、そのNを分解して渡すようにラップする必要があるのかも。
  • 18:58  クエリをリストで渡してマージ済みのposting listを得た方がいいのか。リストをばらして順次投げて、得たposting listsをマージした方がいいのか。いや、同じことかw
  • 18:57  常に一歩上を意識しなければいけないのではないか。と @echizen_tm が言ってた。
  • 18:57  いままでconfigな構造を作らないで、引数で与えていたが、クエリや検索方式を変えても変わらない情報は、configな構造体に突っ込んだほうが良い気がしてきた。でも、なんかなぁ。
  • 18:56  次は、ngramに分解する処理をつくる。
  • 18:55  試しindexに、今までは分解していたクエリを生で投げていたが、ngramのリストから各要素を順に投げるようにした。
  • 18:55  いきなりindex作成部分に組み込むと面倒なので、分解したクエリを順番にNgram生成処理に与える目的でかいていく。
  • 18:54  次は、n-gram indexをするためにn-gramを切り出す部分を作る。
  • 18:53  Query を分解して空のindexにサーチをかけるとこまで出来た。
  • 18:53  書いてなかった発言を順番に書いていく。ポメラ、偉大。
  • 18:23  恵比須
  • 01:31  ニゲルを使いすぎたのでネルー
  • 01:16  @sleepy_yoshi 1ニゲールとか?  [in reply to sleepy_yoshi]

Powered by twtr2src