• Previous
  • Next
  • 文章

    Hive

    数据仓库 1. 数据仓库(Data Warehouse)的概念 数据仓库(Data Warehouse)是一个面向主题的(Subj …

    MapReduce

    Hadoop I/O 流操作 数据完整性 1. CRC-32校验和简介 HDFS会对所有写入数据计算校验和,并在读取数据时再次计算 …

    Python爬虫

    爬虫:模拟浏览器上网,然后让其去互联网抓取数据的脚本。 requests模块 python中原生的一款基于网络请求的模块,功能强大 …

    Hadoop

    Apache Hadoop 概述 Hadoop是Apache软件基金会旗下的一款Java开源软件框架。其提供了大数据存储、计算的一 …

    String

    Python的基本数据类型,是一个不可变的字符序列。 字符串的驻留机制 仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串 …

    Python容器

    列表list 通过方括号括起来的数据序列,可以进行重复数据的存放 创建列表: 1.创建空列表 a = [] a = list() …

    Style

    Fonts