【正版 】流式系统 Sreaming Sysems 数据系统处理 流式作业和批处理作业的正确性 流式批量数据处理模式书籍东南大学出版ttx 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

【正版 】流式系统 Sreaming Sysems 数据系统处理 流式作业和批处理作业的正确性 流式批量数据处理模式书籍东南大学出版ttx精美图片

【正版 】流式系统 Sreaming Sysems 数据系统处理 流式作业和批处理作业的正确性 流式批量数据处理模式书籍东南大学出版ttx电子书下载地址

》【正版 】流式系统 Sreaming Sysems 数据系统处理 流式作业和批处理作业的正确性 流式批量数据处理模式书籍东南大学出版ttx电子书籍版权问题 请点击这里查看《

【正版 】流式系统 Sreaming Sysems 数据系统处理 流式作业和批处理作业的正确性 流式批量数据处理模式书籍东南大学出版ttx书籍详细信息

  • ISBN:9787564183677
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2019-6
  • 页数:329
  • 价格:116.71
  • 纸张:胶版纸
  • 装帧:平装
  • 开本:3开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看

内容简介:

在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然非常合理,但是结果却非常的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。


书籍目录:

Preface Or: What Are You Getting Yourself Into Here?

Part Ⅰ.The Beam Model

1.Streaming 101

Terminology: What Is Streaming?

On the Greatly Exaggerated Limitations of Streaming

Event Time Versus Processing Time

Data Processing Patterns

Bounded Data

Unbounded Data: Batch

Unbounded Data: Streaming

Summary

2.The What, Where, When, and How of Data Processing

Roadmap

Batch Foundations: What and Where

What: Transformations

Where: Windowing

Going Streaming: When and How

When: The Wonderful Thing About Triggers Is Triggers Are Wonderful Things!

When: Watermarks

When: Early/On-Time~Late Triggers FTWI

When: Allowed Lateness (i.e., Garbage Collection

How: Accumulation

Summary

3.Watermarks

Definition

Source Watermark Creation

Perfect Watermark Creation

Heuristic Watermark Creation

Watermark Propagation

Understanding Watermark Propagation

Watermark Propagation and Output Timestamps

The Tricky Case of Overlapping Windows

Percentile Watermarks

Processing-Time Watermarks

Case Studies

Case Study: Watermarks in Google Cloud Dataflow

Case Study: Watermarks in Apache Flink

Case Study: Source Watermarks for Google Cloud Pub/Sub

Summary

4.Advanced Windowing

When/Where: Processing-Time Windows

Event-Time Windowing

Processing-Time Windowing via Triggers

Processing-Time Windowing via Ingress Time

Where: Session Windows

Where: Custom Windowing

Variations on Fixed Windows

Variations on Session Windows

One Size Does Not Fit All

Summary

5.Exactly-Once and Side Effects

Why Exactly Once Matters

Accuracy Versus Completeness

Side Effects

Problem Definition

Ensuring Exactly Once in Shuffle

Addressing Determinism

Performance

Graph Optimization

Bloom Filters

Garbage Collection

Exactly Once in Sources

Exactly Once in Sinks

Use Cases

Example Source: Cloud Pub/Sub

Example Sink: Files

Example Sink: Google BigQuery

Other Systems

Apache Spark Streaming

Apache Flink

Summary

Part Ⅱ.Streams and Tables

6.Streams and Tables

Stream-and-Table Basics Or: a Special Theory of Stream and Table Relativity

Toward a General Theory of Stream and Table Relativity

Batch Processing Versus Streams and Tables

A Streams and Tables Analysis of MapReduce

Reconciling with Batch Processing

What, Where, When, and How in a Streams and Tables World

What: Transformations

Where: Windowing

When: Triggers

How: Accumulation

A Holistic View Of Streams and Tables in the Beam Model

A General Theory of Stream and Table Relativity

Summary

7.The Practicalities of Persistent State

Motivation

The Inevitability of Failure

Correctness and Efficiency

Implicit State

Raw Grouping

Incremental Combining

Generalized State

Case Study: Conversion Attribution

Conversion Attribution with Apache Beam

Summary

8.Streaming SQL

What Is Streaming SQL?

Relational Algebra

Time-Varying Relations

Streams and Tables

Looking Backward: Stream and Table Biases

The Beam Model: A Stream-Biased Approach

The SQL Model: A Table-Biased Approach

Looking Forward: Toward Robust Streaming SQL

Stream and Table Selection

Temporal Operators

Summary

9.Streaming Joins

All Your loins Are Belong to Streaming

Unwindowed loins

FULL OUTER

LEFT OUTER

RIGHT OUTER

INNER

ANTI

SEMI

Windowed loins

Fixed Windows

Temporal Validity

Summary

10.The Evolution of Large-Scale Data Processing

MapReduce

Hadoop

Flume

Storm

Spark

MillWheel

Kafka

Cloud Dataflow

Flink

Beam

Summary

Index


作者介绍:

Tyler Akidau,是Google的高级软件工程师,担任着Data Processing Languages & Systems小组技术负责人的职务。他也是Apache Beam PMC的创始成员。

Slava Chernyak,是Google的高级软件工程师。他花了六年时间研究Google内部的大规模流式数据处理系统。

Reuven Lax,是Google的高级软件工程师,在过去十年间一直在帮助制定Google的数据处理和分析策略,同时他也是Apache Beam PMC的成员。


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!



原文赏析:

In a healthy pipeline, most arriving records will not be duplicates. We can use that fact to greatly improve performance via Bloom filters, which are compact data structures that allow for quick set-membership checks. Bloom filters have a very interesting property: they can return false positives but never false negatives. If the filter says “Yes, the element is in the set,” we know that the element is probably in the set (with a probability that can be calculated). However, if the filter says an element is not in the set, it definitely isn’t. This function is a perfect fit for the task at hand.


其它内容:

书籍介绍

在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然非常合理,但是结果却非常的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。


书籍真实打分

  • 故事情节:8分

  • 人物塑造:5分

  • 主题深度:6分

  • 文字风格:5分

  • 语言运用:4分

  • 文笔流畅:6分

  • 思想传递:4分

  • 知识深度:5分

  • 知识广度:8分

  • 实用性:7分

  • 章节划分:5分

  • 结构布局:4分

  • 新颖与独特:5分

  • 情感共鸣:5分

  • 引人入胜:8分

  • 现实相关:5分

  • 沉浸感:4分

  • 事实准确性:7分

  • 文化贡献:3分


网站评分

  • 书籍多样性:8分

  • 书籍信息完全性:3分

  • 网站更新速度:3分

  • 使用便利性:5分

  • 书籍清晰度:7分

  • 书籍格式兼容性:9分

  • 是否包含广告:7分

  • 加载速度:3分

  • 安全性:3分

  • 稳定性:6分

  • 搜索功能:5分

  • 下载便捷性:6分


下载点评

  • 少量广告(511+)
  • 微信读书(298+)
  • 推荐购买(260+)
  • 书籍完整(483+)
  • 内容齐全(275+)
  • 速度慢(267+)
  • 服务好(528+)
  • 已买(571+)
  • 二星好评(56+)
  • 无盗版(196+)
  • 小说多(392+)

下载评价

  • 网友 冯***卉:

    听说内置一千多万的书籍,不知道真假的

  • 网友 饶***丽:

    下载方式特简单,一直点就好了。

  • 网友 益***琴:

    好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。

  • 网友 隗***杉:

    挺好的,还好看!支持!快下载吧!

  • 网友 通***蕊:

    五颗星、五颗星,大赞还觉得不错!~~

  • 网友 权***波:

    收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!

  • 网友 堵***洁:

    好用,支持

  • 网友 詹***萍:

    好评的,这是自己一直选择的下载书的网站

  • 网友 訾***晴:

    挺好的,书籍丰富

  • 网友 苍***如:

    什么格式都有的呀。


随机推荐