KaggleでSQL-PFへの道⑥結論(The Road to SQL Portfolios with Kaggle(6)Conclusion)

SQLポートフォリオにKaggleは向かない。

理由:

  1. Notebook 40分毎のALL RUN
  2. Google SQL接続
  3. pip初回エラー
  4. Kaggleというプラットフォーム
  5. コンペとコーディングレベルを魅せる場所

はあ。6回かかって結論。理由これだけあればよくないー。。サンクコスト効果は排除、実際試してよかったと思おう。いずれR使って画面上で分析したいときにまた試そう。


1.Notebook 40分毎のALL RUN

Kaggleで書きかけのNotebookを開きっぱなしにして40分たつと、「まだやってる?」とポップアップで問うてくる。大抵SQLやらほかのことと同時進行してるので、すぐ聞かれてしまう。そして毎回のALL RUN、ユーザー多いし仕方ないよね。。


2.Google SQL接続

段階踏んでブログ書いてたので、接続に問題ないと思ってた。が、別テーマで新たにNotebookを書き始めたら、問題が。

リンクされたアカウントの認証情報に問題があります。Kaggleのアカウントページにアクセスし、リンクされたアカウントへのアクセスを無効にしてから、ノートブックエディタのアドオンメニューのGoogle Cloud Servicesでアカウントを再度リンクすることで解決できるかもしれません。

え、今しがた練習問題NotebookでRUNしたけど、新規Notebookはだめなの?てことで、アクセス無効&アドオン有効の手順を経て、Googleに移動。するとCLOUD SHELLターミナルの接続が切れている。なんでー。


しかもこれが終わらない。詰んだ。(←今ここ)


3.pip初回エラー

Notebook開いた初回RUNの度、pip部分で赤字が出る。再度RUNすると消える。原因究明までしなかった(←)けど、一回のALL RUNでSaveしてしまうと、公開Noteに赤字が…完成品として出せずがっかり。これは読む側も動かしたときに初回エラーになるのでは?と思うと、表に出せないなあと。こういうエラー↓

これは再RUNで消えるしバージョンの問題だからたいして気にしてなかった。回重ねるごとに手間になるだろうなとは思ってたけど。


4.Kaggleというプラットフォーム

だんだん雲行きが怪しくなってきた。そもそもKaggleで表示できるのってコーディングの経過とその結果。別ユーザーがその場でRUNして動くことを確認できるので納得するし、他人のコーディングで勉強になるし、しかも無料。目的が合えばとても便利だ。

タイトルは目次型でコーディングの進捗がアイコンを取り巻くラインで分かるようになってる。このへんのUIも好き。プロフ写真決めてないときのデフォ鳥も好き。


5.コンペで切磋琢磨してコーディングレベルを魅せる場所

Kaggleの個人ページには(持ってれば)バッジが表示されて、どのレベルか一目瞭然。なにに特化しているのかも。その表示はステイタスにもなるし、仲間であればどうすごいのかわかるし連絡も取れる。

しかし…Python、Rじゃないポートフォリオを表示する、まして私のようなSQLや可視化を表現するのは難しい。そもそもこの界隈でSQL中身見たい人いるんかな。とさえ思えてくる。ポートフォリオを作るのに、URL張ればプラットフォームはどこでもいいと思ってた。それはKaggkeでなくてもいいのでは。


Kaggleは猛者たちがコンペで切磋琢磨する素敵な世界、という認識は変わってない。そこでどう表現できるかを試してみたかった。結論、表現の手段を一つ学べたということで、いったん離れます。舞台も手段もたくさん知りたい。そこからベターを選びたい。自分おつかれでした!

伝わりやすいポートフォリオをつくりたいなあ。



********


Kaggle is not suitable for SQL portfolios.


Reason:

  1. Notebook requires ALL RUN every 40 minutes
  2. Google SQL reconnection
  3. pip error the first time
  4. Kaggle as a platform
  5. A place to showcase your competition and coding skills

It took 6 times to come to a conclusion. Let's ignore the sunk cost effect and be glad we tried. I'll try again one day when I want to use R for on-screen analysis.


1.Notebook requires ALL RUN every 40 minutes

After 40 minutes of leaving a notebook open on Kaggle, a pop-up asks, "Are you still there?" pops up to ask me. I'm usually doing SQL and other things at the same time, so I get asked right away. And every time ALL RUN. They have so many users, so which is no wonder.

2. Google SQL reconnection

I was blogging in stages, so I thought there was no problem with the connection. However, when I started writing a new Notebook on a different theme, there was a problem.

There is a problem with the linked account credentials. You may be able to fix this by going to your Kaggle account page, revoking access to the linked account, and then linking the account again in the Notebook editor Add-Ons Menu, Google Cloud Services.

Well, I just did a RUN on the training notebook. Can't I use in a new Notebook? So I went through the process of disabling access & enabling add-ons and went to Google. Then the CLOUD SHELL terminal connection is broken. Why is this happening?

And this is not finished. I'm stuck. (←Now here.)


3. pip error the first time

Each time the notebook is opened for the first RUN, a deficit appears in the pip section. It disappears after another RUN. I haven't investigated the cause (←), but when I save with an ALL RUN, the deficit appears in the public notebook... I had to publish version 2 even though I hadn't made any changes.

This makes it difficult to publish when I think that the reader might also get an error the first time reading.

I didn't care much about this because it disappears on reRUN and it's a version issue. I knew it would become more of a hassle with each iteration.


4. Kaggle as a platform

The prospects are becoming less clear. First of all, what you can see on Kaggle is the coding progress and the results. It's satisfying because another user can run it on the spot and check that it works, and you can learn from other people's coding, and it's free. It's very useful if the purpose is right.

The title is a table of contents type, and you can see the coding progress in a line around the icons. I like the UI here too. I also like the cute duck that appears when you don't have a profile picture.


5. A place to showcase your competition and coding skills

Your personal page on Kaggle displays a badge (if you have one) so you can see at a glance what level you are at. It also shows what you specialise in. It's a status thing, and if you're an expert, people can see how great your skills are and contact you.

But... it's hard to show a portfolio that's not Python or R, let alone SQL or visualisation like mine. In fact, I wonder if anyone in the field even wants to see what's in the SQL. I thought that if I put up a URL to create a portfolio, the platform could be anywhere. It doesn't have to be Kaggle.


The perception of Kaggle as a wonderful world of fierce competitors in friendly competition has not changed. I wanted to see how I could express myself there.

The conclusion is that I've learnt one means of expression and I'm leaving once.

I want to get to know many places and means. From there I want to choose better. First, a break. I did well!

I want to make a portfolio that is easy to communicate.