PDO (SQLite) For Wordpressなるものがあるので試し中・・・

テーブルを作るときにSQLのエラーを大量に吐くし。

; CREATE TABLE IF NOT EXISTS wp_terms (
term_id integer NOT NULL PRIMARY KEY AUTOINCREMENT ,
name text NOT NULL default ”,
slug text NOT NULL default ”,
term_group integer NOT NULL default 0) ; CREATE UNIQUE INDEX IF NOT EXISTS slug_44 on wp_terms (slug); CREATE INDEX IF NOT EXISTS name_39 on wp_terms (name)

で、

near “NOT”: syntax error

えーw

;が必要だけどsqlite3のコマンドラインユーティリティからは通る。
追求すると凄くめんどくさい気がするので、
wordpress\wp-content\pdo\driver_sqlite\pdo_sqlite_driver_create.php
の41行近辺の
$this->addIfNotExists();
をコメントアウト。

既にテーブルやインデックスが有るかのチェックだし、そもそも一回テーブル作ればいいだけだし。

俺メモ。
例のseagateのHDDの破損問題のチェック。
https://apps1.seagate.com/rms_af_srl_chk/

当たりが出れば漏れなくHDDが壊れます~♪ぱふぉぱふぉ♪

シリアルナンバーは直接ディスクみるかseatoolででもしらべてちょ。

いずれも恒久的なリンクでないかもしれませんが、張っておきます。

マスコミは斜陽産業だとか新聞社が潰れるとか主張する人がいるので、気になってちょっと作ってみた。
基礎になるデーターはMETI特定サービス産業動態統計調査より。

まず、単純な売り上げ比較・・・と言いたい所なのだが、月毎に非常に幅がある。
具体的には3月がとにかく売り上げが多い。新年度新生活に対しての広告が多いのだろう。
売り上げ金額ベースにして同年1月~2月の150%~200%程にもなる。
これを均すために対象月より12ヶ月前までの平均を用いた。以降は全てこの方式で集計をする。
※前年同月比よりこの12ヶ月平均はより長期的な傾向に注目できるとかもしれない・・・


これを見るとそんなに減ってないんじゃないの?となるけど、
広告業全体での合計が大きい数字だからなぁ。
マスコミさんの傾向は広告業全体と分離した方が解りやすい気がするけどw
とりあえず、広告産業全体は非常に成長している模様。

で、次は広告業全体の売り上げに対しての比率。
これも前述の方式の12ヶ月平均で。

・・・まぁ、減ってるよね。特に新聞。
1988年には20%に届くようなシェアを持っていたけど(実際には単月では21.99%とかもある)・・・
広告業全体では増加しているにもかかわらずシェア減少。テレビも4-5年ほど前からシェアを落としているのもやや気がかり。

そして最後、これは少々ややこしいので説明
各月から売り上げの12ヶ月前までの平均を求めます。これは最初のグラフの数字。
それを全データー(1988年1月~2008年10月)の売上の平均で割ります。
つまり、広告業全体、テレビ、新聞等の自身の動向がわかる仕組み。

新聞はちょっと・・・いや、かなり厳しいですね。
単価の高い人間多いだろうし、でも賞与無しとかリストラと聞かないし・・・どうなんでしょ?
まぁこの辺はマスコミ自身があまり語ろうとしないでしょうけど・・・

一方テレビは色々言われるものの、過去20年の平均とほぼ同じ。
こちらは広告業界全体で売り上げを伸ばしているがシェアを増やすのに苦戦している程度でいいのかな。
時間があればもう少々詳しく調べたいところ。

補足:最後のグラフは月ごとの偏りがある為に1988.1~2008.10では正確では無い。
集計範囲は1988.9~2008.10とするべき。近日中に修正します。

面白い話を聞いたので。間違いがあったらごめん。
自分でいろいろ調べててね。

景気の低迷で自動車売れなくなる。
だとしたら株価が下がるだろと踏んだヘッジファンド。
フォルクスワーゲンを含む自動車関連の株を空売りしちゃった訳です。大量に。

ポルシェですが、ライバルのフォルクスワーゲンの株を買収目的で買ってたわけです。
で「いっぱい買っちゃった。大体74%ぐらいかな」と発表。

で、ヘッジファンドはふと気がついた訳です。
フォルクスワーゲンの株はポルシェが74%ほど取得した。
それとドイツの自治体が20%程持ってる。合計で94%。
つまり市場に流通しているのは6%しかない。
ヘッジファンドが空売りした発行済み株式数を合計してみると12%になった。
空売りは当然、返済期日までに株を買って返さなければいけない。返さないと破綻。
空売りは株価が上がれば損害は大きくなり、無限に株価が上がるとしたら損害も無限。

どうなったか。
椅子取りゲームが発生したわけです。椅子の数は定員の半分。
ポジションの解消・・・まぁ要するに株を返せなきゃ破滅。

yahoo.deのフォルクスワーゲンの株価を見てみましょう。

そりゃ破綻するよりは大損しても椅子を買ったほうがマシなのです。
当然フォルクスワーゲンの株価が大暴騰し、ヘッジファンドは巨額の損失を抱えることに。
フォルクスワーゲンの時価総額は瞬間風速ながら世界一に。
そしてポルシェの含み益は天文学的な数字に。

本業は自動車屋なのであまり野心がなかったのですかね?
取得した株の一部を市場に放出して一応の決着。
それでもヘッジファンドの被った損失はかなり巨額らしいですが・・・

※法規制の問題でドイツではこれはOKみたいですね。


単純に投稿数で見ると結構上下が激しいのですよね。
以前の調査で曜日によって投稿数に違いがあることが判明しまして。
そこで前後3日とその日の7日間の平均を取って平滑化。

とりあえず見て思ったこと。
歴代投稿数1位は8月31日初音ミク一周年記念日。
2位は何故か12月30日。社会人が正月休みに入ったから作り始めたのか?
3位は3月9日でミクの日。

今年の正月で一気に製作者人口が増えた感じがする。
春休み(3月最終週前後から4月の第1週前後)は何故か投稿数が増える傾向が見られない
GWは効果が認められる。前半は少ないが連休後半は増加。
夏休み(7月下旬から8月末)+社会人の盆休み影響が認められる。

割と重要な数値を上げてなかったような。

  再生数 コメント マイリスト 投稿後経過日数 再生時間(秒)
再生数 1
コメント 0.444448563 1
マイリスト 0.90600564 0.23969817 1
投稿後経過日数 0.081383718 0.013335488 0.040543259 1
再生時間(秒) 0.008131167 0.009621531 0.010191425 -0.040924981 1

簡単に説明すると、相関は1か-1に近ければ近いだけ強い相関。0が相関がないってな感じです。
(もっとも相関だけでは関連性の全てを表せられないです。詳しくはググってください。)
例えば再生数と再生数を比べた場合は1。そりゃ同一のデーターで完全に一致するわけですから。

マイリストと再生数は0.90600564と非常に強い相関関係を持ってます。
が、コメントと再生数は0.444448563で中程度、コメントとマイリストでは0.23969817と弱い相関です。
というか、隠れた良曲探しのときにコメント数で色々酷い目にあってまして。
個人的にあまりコメントは重要視してないというかなんというか・・・w

あと再生時間と投稿後経過日数は動画の人気には殆ど関係しないみたいですね。

まぁ時間作ったなら曜日もやろうか、などと思ったり。
やってみたわかったけど・・・曜日では殆ど変化なし。ウボァw
でも曜日で変化が無いことが判ったというのは成果だ。多分。
ちょっと悔しいですがデーター乗せときます
現状で一日140件とかの動画投稿があり、集計日が一日ずれただけでそれだけ誤差が出ます。
ですので、厳密な話ではないです。話の種程度に。

投稿件数 再生数平均 再生数中央値
7267 6573 1276
6134 7008 1278
5872 7098 1233
5677 7619 1213
5935 6865 1201
7948 5951 1234
9611 5796 1146

で、グラフ。

再生平均は週末近くがへこんでるわけですが、中央値は殆どかわらず。
一方投稿数は再生平均がへこんでる週末に伸びている。この辺が少々興味深い。
あと、投稿数の月曜日が多いのは多分0:00過ぎて月曜日になったとかですかね。

採取データーは例によって9/12日辺りですので、現状と異なる可能性があります。
まず、夏以前の集計。
正確には08/07/05 18:00以前の投稿データーの集計

(夏)以前の集計
投稿時間(24時) 投稿数 再生数平均 再生数中央値 マイリスト平均 マイリスト中央値
0 3045 6536 1375 143 11
1 2745 8543 1348 201 11
2 2405 7466 1493 186 11
3 1798 7613 1670 201 14
4 1460 10028 1876 274 16
5 1321 10939 2294 317 21
6 1034 15488 2052 411 18
7 912 8376 1541 236 14
8 799 10484 1891 268 17
9 713 8311 1756 211 13
10 787 6788 1423 156 13
11 877 5957 1389 144 11
12 957 6194 1481 161 12
13 1043 5521 1416 110 10
14 1134 5307 1436 107 11
15 1206 7739 1293 229 10
16 1396 6101 1306 118 9
17 1555 7130 1433 171 11
18 1742 7408 1489 180 11
19 1808 8559 1526 232 11
20 1996 8397 1333 224 10
21 2266 5102 1275 120 11
22 2559 6503 1273 163 10
23 2799 5844 1286 131 10

そして夏以降、08/07/05 18:00以降の投稿データーの集計

(夏)以降の集計
投稿時間(24時) 投稿数 再生数平均 再生数中央値 マイリスト平均 マイリスト中央値
0 891 3359 597 124 7
1 661 2792 606 89 7
2 541 3205 619 106 8
3 386 3050 631 136 8
4 327 6212 895 201 13
5 320 5017 1034 199 13
6 226 4919 783 213 10
7 197 4185 741 140 10
8 179 2841 700 112 9
9 165 2256 818 69 8
10 198 1934 484 67 5
11 250 1907 478 49 4
12 284 4341 576 164 6
13 264 5916 622 185 7
14 272 2180 580 79 7
15 340 1838 557 53 6
16 366 2574 510 71 6
17 386 1531 443 49 6
18 453 2198 541 84 6
19 580 2285 620 47 7
20 555 2167 463 70 6
21 656 2913 500 112 7
22 763 2230 469 52 6
23 827 3316 516 123 7

夏以前のデーターは長い時を経ている(ミリオンが含まれるほど)のデータですので、単純に比較はできません。
んで、ごまかす為(?)に0時を100%とした比率でグラフを作成。
マイリストはまぁ似たような動きをするし線が増えてごちゃごちゃすると見にくくなるので割愛。
見るべきはどちらかというと中央値。青い方のグラフです。

例の4時だか5時投稿説は関連有りそうですよ。夏以降も。
しかし中央値から見るにその手の期待をするなら午前3時以降午前9時ぐらいまでにうpすれば大体同じかもしれない。

もっとも何故関連しているのかというのまでは調べきれませんが。
その位の時間を待って投稿するボカロ廃は単純に良い作品を作るのか、それともやはりシステム的な影響があるのか。
詳細な分析は見てる人に任せます。
人の少ないと思われる時間帯が良い成績を出してますし、負荷分散の意味からも良いかもしれませんね。

ちなみに夏以降再生数平均で午前6時が突出しているのが目に付きますが、ここはヤバイです。
中央値に大きく変動が無いのに平均値がゴリゴリ上がっているのは平均を押し上げる化け物がいっぱい居る証拠です(笑
ただ、どちらかというと時間帯より曜日や休日前等の方が影響ありそうですけどね。
時間があったらそちらも調べてみます。

あ、あと。ボーカロイド関連埋もれた名曲リストとか作りました。
再生少なくても凄くいい曲多いです。
お時間のあるときに見てもらえれば幸せです。

説明にもありますが、かなりアグレッシブな集計方法です。
アグレッシブ過ぎてマイリスト率が高い曲を抑えて再整数が低い曲が割り込むことがあります。
再生数100以下も結構上位に散見する不思議チャートです。
集計方法を僅かに変えただけで大幅に変わるんですよね、この手のチャートは。
あくまでも発掘の補助程度に考えてもらえれば。

あとデーターは大きめのテーブルです。
閲覧環境によっては酷いことになるかもしれません。注意。

ボーカロイド関連埋もれた名曲リスト2008.9.12採取分(1/2)

で、幾つか見てるわけですが、良い曲発見。
なんでこの曲が再生650とかなんですかね?
エクセル弄りながらリピって聞いてましたが、作業ソングにいいですねこれ。

ううう。今日国立博物館のスリランカ展に行こうと思ってたのにこんな時間だわさ・・・。

日付で区間を作って近似式を作ってて何かおかしいなぁと悩んでたわけですが(アホ)
明らかに初音ミク発売後とそれ以前のデーターの傾向が全然違う。
というか、一日辺りの投稿数が少ないために(0~1とか)中央値でも極端な数字が出るような感じ。
それと鏡音リン&鏡音レン発売以降も微妙に傾向が違う気もする。
区間の取り方を考えるかモノによっては古いデーターは捨てないとダメですな・・・
ちなみに360日から後辺りで再生数が0になってるのはその日に投稿が無いということ。

それと動画投稿件数の多項式近似の次数は6。
これだけ見ると投稿数が減少傾向に見えるかもしれないけど、そうではないデス。
この近似曲線の特性みたいなものらしい。
ちなみに次数を4にすれば近似曲線は増加傾向になる。