Pythonで仕事をしたいと思ったら、最初に候補に上がるといっても過言ではないWEBスクレイピング。
今回、私が勉強している本について紹介します。
【参考書籍】
【Amazon】
もうすぐ第二版が出るようです。両方貼っときます。
【楽天】
【f】
from モジュール名 import * (①p111)
・・・関数前のモジュール名を書かずに済ませる方法。
importとの違いは、モジュールの全体を利用するのがimportで、 モジュールの一部(変数や関数だと思ってください。)を利用するのがfrom。
(例) from turtle import *
→文中でshape("turtle")と省略できる。
【r】
range関数(②p007.穴埋め式クイズ)
・・・整数の並びを生成するrangeオブジェクトを作成する。
Pythonの組み込み関数の一つ。
【な】
内包(ないほう)表記(日経ソフトウェア 2021年付録)
・・・「リスト」や「辞書」など、「繰り返し可能オブジェクト」のループ処理を、簡潔に記述するための記法。
【も】
モジュール (①p106)
・・・ある仕事を行う命令を別ファイルに分けて使うようにしたもの。
・・・importで読み込むファイル
(例)
import モジュール名 (import する)
モジュール名.関数名 (importしたモジュールの関数を使用する)
【参考書籍】
①
②
機械学習とは、人間が知識を教えるのではなく、コンピュータにたくさんのデータを与えてコンピュータ自身が学習する方法です。
コンピュータが学習する方法は、3つあります。
「問題」と「答え」のペアを大量に与えて、特徴を学習させる方法
コンピュータが問題と答えのデータ(教師データ)のペアを大量に見て、特徴を学習することで、「どのような問題は、どのような答えか」を把握できるようになる。
そのため、新しいデータを与えた時、その特徴からそれが何なのかを答えることができる。
文字認識・音声認識・翻訳 などで使われる。
教師データ・・・問題に対する答えのデータのこと。(教師代わりのデータという意味)
答えのない大量のデータを調べ、グループ分け(クラスタリング)をさせる方法
(答えをみつけるための学習ではない)
コンピュータにたくさんのデータから似たモノ同士を見つけて、グループ分けをさせる。
コンピュータにいろいろ移行錯誤させて、良い結果が出た時に「報酬」を与えて強化していく方法
→「問題と答えのペアは教えないが、よい答えを思い出させるための学習」
【参考書籍】
Lesson23 より
【Amazon】
【楽天】