読者です 読者をやめる 読者になる 読者になる

タイフェスティバル

に行ってきました.

・食事の割合が若干減ってたような?去年までは入口からすぐ食べ物の露店ばっかりだったのが,今年は入口沿いはグッズとか情報関係に変わっていたような.フルーツ店も若干奥の方に押しやられた感じがあります.対して,何故かタイに関係ない露店は増えていたような.一体どうなってんだろ?露店が集まらなかった?毎年賑わっているのに?

・微妙にカレー系が減ったような.気のせいかも.

・人多過ぎ.尤も,昨日が雨だったので今日に集中した可能性も否めず,本当に人数が多かったのかどうかは不明.気温低くて本当に良かった.

・ゴミ捨て場が元に戻ってた.何のことかと言うと,それまでゴミ捨て場は普通に野ざらしにバケツが並べられていて,スタッフの人なんかが手伝ってくれながら捨てるような感じだったのです.ところが,去年見た目がイケてないと思ったのかどうなのかは分からないけど,リサイクルセンターとかいう感じに名前を変え,周囲をテントで囲ってしまったのですね.そのせいでちょっと離れると何処がゴミバケツが見えないし,リサイクルセンターという名前のせいでいまいちピンと来ないわで困った印象があったのです.

・フルーツ市場のドリアンが半冷凍状態でシャーベット状で売られていた(いつも生).たまたまかも知れません.個人的には半冷凍の方が美味しいと思いましたけど.

XGBoost

を入れるのに半日近くかかってしまった…

ここまでメジャーなんだから,Anaconda Navigatorから簡単に入るようにしてくれればいいのになぁ…パソコン周りのこういうとこ,ホント嫌い.

〜経緯〜

・公式サイト(?)の指示通りにターミナルで入力するもなんかコンパイルのときに色々エラー表示と思しき赤い文字列がチラホラ出るも無視して続行.

→案の定,import xgboost as xgbとかやっても全然ダメなので,公式サイトをよく見てみたら,gccのバージョンが6以上じゃないと何たらかんたら.

gccのバージョンの調べ方が分からなかったが,何とかgcc -vとか入れればいいことを知る.4.2とかそんぐらいが入っていることが発覚.

gccの公式サイト(?)から最新版をDLしようとするも圧縮ファイルの置き場所は分かったがインストール方法が分からない

Mac portでインストールできるということを知り,version 7を入れてみたが,どうやってもgcc -vが4.2のまんまでパスが通らない.

brewで入れるのが普通みたいなので,brew経由でバージョン6を入れてみたら,何とかgcc -vでバージョン6になってくれた模様.

→やっとxgboostのコンパイルができるぜ!と思ったら,今度はstdio.hが無いとかでやっぱりコンパイルできない(stdio.hがデフォルトで入らないようなものをインストールと呼んでいいんだろうか?とか思ったりもしました).

xcodeのターミナルツールが削除されるので入れ直さないといけないということを知り,指示通りに入れ直す.

→xgboostのコンパイルが…できた!で,import xgboost as xgbで,エラーが出ない!

 

もう遅いのでXGBoostを試すのは明日にしよう.それにしても,全てのステップで誰かしらの書いたブログを参照しているわけで,ネットの無かった頃だと本当にどうにもならなかっただろうなぁ…

PRMLで学んだ色々なアルゴリズムが

Scikit Learnでことごとく実装されててあの勉強時間(半年強)は何だったんだろうと思わずにはいられない今日この頃(しかもPRMLの内容どんどん忘れてきてるし!).

・サンプリングだけは実装されている感じがしないのですけど(見つけられないだけか?),一体どういうことなんだろう?他のモジュールで既に実装されてる?それともあくまでScikit Learnの段階ではパラメータを求めるのが目的という認識なのだろうか?

・MH法だけ試しに実装してみたのですけど,これって分岐含んでるからGPU使っても速くならんのでしょうね…

 

ギンザシックス

に行ってきました.

・思ってたより普通のデパートだなぁというのが正直な感想.

・中央の吹き抜けが物凄く広そうに写ってるのは完全にフカシのように感じます.その他に関しても特にスペースを広く取っていたり天井が高いようには感じませんでした.ぶっちゃけ東京ミッドタウンの方がずっと贅沢にスペースを使っていると思います.

・斜めの直線・白と金というのが基調になっているのかなーと.

・名札の付いてない店が多かったように思います.名札が付いていた中でダントツで高かったのはフランクミュラーのエテルニタス・メガ5(3億5000万)でしょうか.ちなみにフランクミュラーのブックカバーが貰えます.

・警備員が凄いウロウロしてます.

・男性用トイレが1・2階に無い上,場所が分かりにくく感じました.

・6階のレストランは,幾つかの店を除くとディナーは1万円弱という価格設定で普段使うのは厳しいように感じます.

・蔦屋書店は見尽くしたわけではありませんが,アート系の本が沢山置いてあって(代官山もそうだけど),スタバと混合しています.日本刀が展示してありました.

そろそろPRMLを読み終わりそうなので

(一応既に最後まで目は通したが,算式の導出はしてないのが幾つかある),はじめの頃に挫折した通称はじパタをパラパラめくってたんですけど,

やっぱ今見てもはじパタの方がずっと難しく感じられるというか,何ではじパタが入門でPRMLは壁みたいに言われてんのかサッパリ理解できない…

はじパタすんなり理解できる人がPRMLの算式で苦戦するとかありえないと思うんだけど(自分はPRMLの算式で苦戦したことはほぼ無い.ってかアンチョコ本が出てるのが信じられないと言うぐらいにサクサク行けた).

機械学習やる平均的な層の得意な数学の分野・傾向と自分のそれとが大きく隔たっているのかな…ないしは↑の層が実は別々でお互い全く一致してないのか…

うーん,謎だ…

PRMLを

ようやく読み終わりそうだと喜々として13章を進めてたら,とっくの昔にやって忘れてしまったグラフィカルモデルの積和・Max-Sumアルゴリズムが出てくるという…

やったの2ヶ月以上前だよ…覚えてないよ…

読書:ゲノム編集とは何か

■サマリ

・従来の遺伝子組み換え技術1970年に端を発する古い技術であり,精度に大きな問題を抱えていた.たった1個の遺伝子を組み換えるために,科学者が1万回・あるいは100万回もの実験を繰り返した挙げ句,やっと1回だけ狙ったとおりに組み替えることができるという,極めて精度の低い技術であった.また,特定の箇所でしか遺伝子を切断・改変することができなかった.更に,汎用性に乏しく,ケースバイケースで様々な手法を使い分け・組み合わせる必要があった.
・これに対し,クリスパーと呼ばれるゲノム編集技術(2012年頃欧米で開発)では,ゲノム全体を対象として,科学者が狙った遺伝子やDNAを構成するGTCAを,1文字1文字ピンポイントで・複数箇所同時に,削除したり書き換えたりすることができる.失敗率(オフ・ターゲット効果)は現時点で1%以下,あらゆる動物や植物のDNAにも適用できる汎用性等を備えている.
・専門家が「高校生でも数週間で使えるようになる」と太鼓判を押すほど扱いやすい技術であり.従来の遺伝子組み換えに要していた期間やコストが劇的に改善された.例えば,従来ではノックアウトマウス(免疫機能等を破壊したマウス)の作成に1年はかかるところ,クリスパーでは3週間(作業そのものは1日もかからない.残りはマウスが成育するための期間)に短縮された.
 
■関与した人間
・(ダウドナ・シャルパンティエバークレー)・(チャン@ハーバード&MIT)
・最初に,分離したDNAに対して実験を行い論文を出したのは前者コンビだが,生きた細胞に実験して特許を取ったのは後者.現在係争中.
 
■クリスパーのメカニズム
・クリスパーとは「規則的に間隔を置いた短い(数十文字程度)回文(前から読んでも後ろから読んでも同じになる文)の反復」の略である.具体的には[回文][スペーサー][回文][スペーサー][回文][スペーサー]…という配列.
・ある特定のバクテリアのゲノムはこのクリスパー配列を持つ(1987年に阪大が大腸菌で発見).その後の2000年頃,スペーサーは,過去にこのバクテリアを攻撃したウィルスのDNAの一部であること・バクテリアはウィルスを見つけるとDNA部分をスペーサーと比較して,一致すると先制攻撃としてDNAを切り刻んで殺すことが分かった(つまりはバクテリアの免疫機構).
・メカニズム:クリスパー内部のスペーサーはガイドRNAという特殊なRNAを生成し,これがクリスパー近くの遺伝子から発現するタンパク質であるCsn1(現在はCAS9と改名)と結合して特殊な複合体を生成する(Csn1はDNAを特定の場所で切断するヌクレアーゼという酵素の一種).この複合体はガイドRNA部分に一致するウィルスを発見すると,塩基の相補性(DNAの2本螺旋は各対応部分でペアになる組み合わせが決まっている)によってRNA部分でウィルスに結合する.その後Csn1の構造が変化してウィルス側のDNAを切断する.
・その後,クリスパーは単に対ウィルスのみならずあらゆる生物のDNAに使用できること,切断後に特定の長さの塩基配列を挿入して再接続できることもわかった.
・ガイドRNAは人工的にプログラム・合成することができる.
 
■DNA・ゲノム・遺伝子に関する背景知識
・DNAとは物質(デオキシリボ核酸)・ゲノムとはDNA上の配列による情報・遺伝子とはその一部分のことである.遺伝子は,タンパク質の作り方を記憶している部位で,DNA全体の25%(狭義には1.5%)程度.
・人間のゲノムのサイズは32億対・GTCAの4文字が使えるので情報量としては約800MBでCD1枚よりやや大きいぐらい.
・人間のDNAの長さは約170cm
・人間のゲノムの5%はあらゆる生物に共通のものである.人間間でのDNAの違いは0.1%(320万塩基対)
・新生児は平均50〜100程度のゲノムの突然変異を持って生まれてくる
 
■法的問題等
・人類の改良(デザイナー・ベビー)〜治療との境界は何処か?
・遺伝子ドライブ:マラリアを媒介する蚊の遺伝子を改変して環境にダメージは?
・イギリスは生殖医療に関しては進歩的な姿勢.アメリカはキリスト教保守派の関係で消極的.
・精度が高いので,従来の遺伝子組み換え作物より安全かもという意見も.
 
■その他
エイズとペストは両者ともT細胞の特定の突起をとっかかりにして攻撃する.ペストの生き残りはT細胞にこの突起が無く,エイズも発症しづらい.
遺伝子治療は劇的な成果を上げる一方,死者も出てたりしていて,未だ不安定な感じらしい.
・クリスパーを効果的に運用するためには,ターゲットとなる遺伝子・メカニズムが理解されている必要があり(どの遺伝子が悪さをするかが分かってなければターゲッティングしようがないので),そのためにAIやビッグデータ技術が用いられ,グーグル・アマゾンが投資・参入している

 

https://www.amazon.co.jp/s/ref=nb_sb_noss?__mk_ja_JP=カタカナ&url=search-alias%3Daps&field-keywords=ゲノム編集www.amazon.co.jp