当前位置: 首页 > news >正文

专业网站设计公司行业天然气集团有限公司原副总经理

专业网站设计公司行业,天然气集团有限公司原副总经理,集约化网站群建设方案,网站开发项目经理岗位职责TopN 定义#xff08;⽀持 Batch\Streaming#xff09;#xff1a; TopN 对应离线数仓的 row_number()#xff0c;使⽤ row_number() 对某⼀个分组的数据进⾏排序。 应⽤场景#xff1a; 根据 某个排序 条件#xff0c;计算 某个分组 下的排⾏榜数据。 SQL 语法标准⽀持 Batch\Streaming TopN 对应离线数仓的 row_number()使⽤ row_number() 对某⼀个分组的数据进⾏排序。 应⽤场景 根据 某个排序 条件计算 某个分组 下的排⾏榜数据。 SQL 语法标准 SELECT [column_list] FROM (SELECT [column_list],ROW_NUMBER() OVER ([PARTITION BY col1[, col2...]]ORDER BY col1 [asc|desc][, col2 [asc|desc]...]) AS rownumFROM table_name) WHERE rownum N [AND conditions];ROW_NUMBER() 标识 TopN 排序⼦句PARTITION BY col1[, col2…] 标识分区字段代表按照这个 col 字段作为分区粒度对数据排序取 topN下述案例中的 partition by key 根据需求中的搜索关键词key做为分区ORDER BY col1 [asc|desc][, col2 [asc|desc]…] 标识 TopN 的排序规则是按照哪些字段、顺序或逆序进⾏排序WHERE rownum N 这个⼦句是必须的加上这个⼦句Flink 才能将其识别为 TopN 查询其中 N 代表 TopN 的条⽬数[AND conditions] 其他的限制条件也可以加上。 实际案例 取某个搜索关键词下的搜索热度前 10 名的词条数据。 输⼊数据为搜索词条数据的搜索热度数据当搜索热度发⽣变化时会将变化后的数据写⼊到数据源的 Kafka 中 数据源 schema-- 字段名 备注 -- key 搜索关键词 -- name 搜索热度名称 -- search_cnt 热搜消费热度⽐如 3000 -- timestamp 消费词条时间戳 CREATE TABLE source_table (name STRING NOT NULL,search_cnt BIGINT NOT NULL,key STRING NOT NULL,row_time timestamp(3),WATERMARK FOR row_time AS row_time ) WITH (connector filesystem, path file:///Users/hhx/Desktop/source_table.csv,format csv );A,100,a,2021-11-01 00:01:03 A,200,a,2021-11-02 00:01:03 A,300,a,2021-11-03 00:01:03 B,200,b,2021-11-01 00:01:03 B,300,b,2021-11-02 00:01:03 B,400,b,2021-11-03 00:01:03 C,300,c,2021-11-01 00:01:03 C,400,c,2021-11-02 00:01:03 C,500,c,2021-11-03 00:01:03 D,400,d,2021-11-01 00:01:03 D,500,d,2021-11-02 00:01:03 D,600,d,2021-11-03 00:01:03-- 数据汇 schema -- key 搜索关键词 -- name 搜索热度名称 -- search_cnt 热搜消费热度⽐如 3000 -- timestamp 消费词条时间戳 CREATE TABLE sink_table (key BIGINT,name BIGINT,search_cnt BIGINT,timestamp TIMESTAMP(3) ) WITH (... );-- DML 逻辑 INSERT INTO sink_table SELECT key, name, search_cnt, row_time as timestamp FROM (SELECT key, name, search_cnt, row_time, -- 根据热搜关键词 key 作为 partition key然后按照 search_cnt 倒排取前 2 名ROW_NUMBER() OVER (PARTITION BY key ORDER BY search_cnt desc) AS rownumFROM source_table) WHERE rownum 2输出结果 注意 包含回撤流。 上⾯ SQL 会翻译成以下三个算⼦ 数据源 数据源即最新的词条下⾯的搜索词的搜索热度数据消费到 Kafka 中数据后按照 partition key 将数据进⾏ hash 分发到下游排序算⼦相同的 key 数据将会发送到⼀个并发中 排序算⼦ 为每个 Key 维护了⼀个 TopN 的榜单数据接受到上游的⼀条数据后如果 TopN 榜单还没有到达 N 条则将这条数据加⼊ TopN 榜单后直接下发数据如果到达 N 条之后经过 TopN 计算发现这条数据⽐原有的数据排序靠前那么新的 TopN 排名就会有变化就变化了的这部分数据之前下发的排名数据被撤回即回撤数据然后下发新的排名数据 数据汇 接收到上游的数据之后然后输出到外部存储引擎中。
http://www.hkea.cn/news/14441112/

相关文章:

  • php网站的首页网页制作教程width
  • 舟山企业网站建设专业简历制作网站有哪些
  • 外贸网站开发哪家好河北做网站的公司
  • 公司网站如何seo门窗网页设计制作
  • 网站建设与管理工作内容聊城感染最新数据
  • 英文网站推广方法wordpress 防爬
  • 静态展示网站模板下载自建网站做外贸
  • 钢丝高频退火设备网站建设动漫设计与制作学什么课程
  • 炫酷文字制作网站有个网站做彩盒的
  • 苏州网站开发公司一个外国人做汉字网站
  • 模板网站也可以做优化seo数据优化
  • 360免费网站建设谷歌网站地图提交
  • 网站回头率android 登录wordpress
  • 网站建设要多少钱app招聘网站开发手册
  • 机械加工厂家windows优化大师官网
  • 邢台企业网站建设报价佛山网站建设佛山网络推广
  • 深圳商业网站建设系统外贸建站与推广如何做手机壳
  • 珠海专业做网站制作产品推广方案设计
  • 教师可以做网站吗天津西青区
  • 资源网站建立网站用什么软件
  • 绵阳高端网站建设学网站建设难吗
  • 安庆做网站电话外贸常用的网站
  • 一个网站一年的费用多少缘震网络网站建设之f套餐
  • 手机版怎么做微电影网站全球十大搜索引擎排名及网址
  • 做企业网站通常哪找素材网络科技公司洛阳
  • 360网站推广官网软件wordpress 文章页模板
  • 广告手机网站制作下载微信找回微信
  • 抖音推广方式成都网站seo技巧
  • 网站里的轮廓图 怎么做的网站网站怎么做的
  • vps设置网站访问用户权限网站建设 网站推广