吴良超的学习笔记

python读取文件夹下所有文件的一种方法

发表于 2016-02-10 标签 python

在数据挖掘中需要大量的数据，这些数据往往存储在数据库中或者文件中。存储数据库中比较好理解，可通过 程序数据库接口+SQL语句 获取。存储在文件中则往往有多个按日期命名的文件夹，数据以文本格式存储，且有特定的分割符。本文主要就是讲述如何通过python读取后一类的数据。

阅读全文 »

网络编程简介

网络通讯的方式有TCP和UDP两种，其中TCP方式的网络通讯是指在通讯的过程中保持连接，有点类似于打电话，只需要拨打一次号码(建立一次网络连接)，就可以多次通话(多次传输数据)。这样方式在实际的网络编程中，由于传输可靠，类似于打电话，如果甲给乙打电话，乙说没有听清楚让甲重复一遍，直到乙听清楚为止，实际的网络传输也是这样，如果发送的一方发送的数据接收方觉得有问题，则网络底层会自动要求发送方重发，直到接收方收到为止。

阅读全文 »

LeetCode解题报告(11)--双指针找最大储水容器

发表于 2016-02-05 标签 python ，双指针

原题如下： >Given n non-negative integers a1, a2, ..., an, where each represents a point at coordinate (i, ai). n vertical lines are drawn such that the two endpoints of line i is at (i, ai) and (i, 0). Find two lines, which together with x-axis forms a container, such that the container contains the most water.

阅读全文 »

LeetCode解题报告(5)--最长回文子字符串

发表于 2016-01-24 标签 python ，动态规划，字符串

原题如下：

Given a string S, find the longest palindromic substring in S. You may assume that the maximum length of S is 1000, and there exists one unique longest palindromic substring.

就是要从给定的字符串中找出最大的回文子字符串。

阅读全文 »

《Programming Collective Intelligence》读书笔记(1)--梗概

发表于 2016-01-24 标签集体智慧编程

《Programming Collective Intelligence》（中文名为《集体智慧编程》），是一本关于数据挖掘的书籍，每一章都会通过一个实际的例子来讲述某个机器学习算法，同时会涉及到数据的采集和处理等，是一本实践性很强的书籍。

本文是关于本书的第一章 Introduction to Collective Intelligence ,主要介绍了 collective intelligence 以及 machine learning 的一些概念。

阅读全文 »

《Advanced Web Metrics with Google Analytics》读书笔记(2)

发表于 2016-01-22 标签 Google Analytics

《 Advanced Web Metrics with Google Analytics 》是 Google 一位数据分析专家 Brian Clifton 出版的书，主要介绍了涉及网站分析的一些概念和方法以及如何利用 Google Analytics 进行网站分析。Google Analytics 是 Google 免费提供的一个用于网站分析的工具。

阅读全文 »

《Advanced Web Metrics with Google Analytics》读书笔记(1)

发表于 2016-01-20 标签 Google Analytics

《Advanced Web Metrics with Google Analytics》是 Google 一位数据分析专家 Brian Clifton 出版的书，主要介绍了涉及网站分析的一些概念和方法以及如何利用 Google Analytics 进行网站分析。Google Analytics 是 Google 免费提供的一个用于网站分析的工具。

阅读全文 »

通过 python 发送邮件提醒网站的新评论

发表于 2016-01-17 标签 python

这篇文章是当时在新浪云上搭建博客的时候写的，后来因为新浪云收费了，把网站迁移到了github上。这里还是把文章贴出来，做个记录。

最近在写本站的评论提醒功能的时候，需要通过 python 发送邮件提醒具体哪些文章有了新评论，采用邮件的方式便于在特定时间处理所有的评论，比如说在第二天早上7点检查网站昨天是否有新的评论，假如有就会发送邮件显示那些有新评论的文章。

阅读全文 »

炒股损失的不仅是钱,年轻人请远离股市

发表于 2016-01-17 标签闲话几句，转载

转载，作者：李晓鹏，侵删

这篇文章本来是该几年前写的，奉劝大家不要去玩股票。因为那个时候我的《中国崛起的经济学分析》这本书刚刚出版，里面用“破坏性要素参与分配”的理论来分析了中国经济。在写作过程中我发现这个理论也可以顺便用来解释股票市场，让大家看清楚股票市场的本质。但当时的大盘指数才1980点，我怕写出来很多人会被我“忽悠”，把手里的股票“割肉”卖掉，回头会恨死我。所以就忍了。

阅读全文 »

命令行编译Java源文件

发表于 2016-01-13 标签 Java

众所周知，Java是一门编译型语言，需要编译成字节码才能在JVM上运行。常用的IDE如Eclipse等将编译、运行等步骤结合起来一起执行，只需要按下Run即可完成编译和运行的工作。但是实际上编译java程序的核心是JDK。本文主要讲述了只安装jdk通过命令行来编译运行Java程序。

阅读全文 »