当前位置: 首页 > news >正文

自己做网站收费么免费网页建设

自己做网站收费么,免费网页建设,在哪里可以免费观看最新电影,网站建设中的英文原理分析 pg_lakehouse 是 ParadeDB 推出的一个开源插件#xff0c;支持对多种数据湖里的数据做分析计算。它的出现#xff0c;使得 Postgres 能够像访问本地数据一样轻松访问 S3 等对象存储#xff0c;轻松访问 Delta Lake 上的表格#xff0c;具备数据湖分析能力。 pg_…原理分析 pg_lakehouse 是 ParadeDB 推出的一个开源插件支持对多种数据湖里的数据做分析计算。它的出现使得 Postgres 能够像访问本地数据一样轻松访问 S3 等对象存储轻松访问 Delta Lake 上的表格具备数据湖分析能力。 pg_lakehouse 的查询计算能力是通过 Apache DataFusion 来支持的。DataFusion 是一个纯计算引擎它不负责存储内置了几种数据格式支持并且可以通过 TableProvider 接口支持更多的数据输入方式[ref]。 从原来上看 pg_lakehouse 提供了一组访问数据湖的方法并将这些方法和 DataFusion 的计算能力结合起来帮助 Postgres 获得分析数据湖数据的能力。 也就是说Postgres 基于 pg_lakehouse 做数据湖分析时计算能力主要靠 pg_lakehouse 提供而不是依赖 Postgres 自身的计算引擎。Postgres 的价值在于给用户提供一个一致的操作界面如 SQL dialect、schema view、生态工具等。 用户访问数据湖的整体交互流程如下 SQL -(pgsql)- Postgres -- pg_lakehouse -(FDW, DF understandable SQL Dialect)- DataFusion pg_lakehouse 对数据湖的访问是基于 postgres 外表界面实现的。有几点需要注意 集成湖的 catalog 不是必须的。Doris 等湖仓一体的数据库为了简化用户使用会做 Multi External Catalog 集成自动导入外表 schema。pg_lakehouse 依然要求用户在 Postgres 中创建外表。pg_lakehouse 支持通过 arrow_schema function 来自动获取湖中数据的 schemaPostgres 还支持类似这样的语法批量导入外部 schema但对于 lakehouse 的支持程度如何暂未调研import foreign schema public from server duckdb into public; Thinking in MyDB 对于 MyDB 来说计算引擎部分依然是使用 MyDB 自身的计算引擎无需依赖第三方如 DataFusion、Volex。 MyDB 重点是实现可扩展的数据湖接入策略降低接入新存储、新格式的成本。我们要区分好 Object Stores、File Format 和 Table Format 三方面的需求各自做好扩展。 Object Stores Amazon S3Aliyun OSSTencent Cloud COSHuawei Cloud OBSS3-compatible object stores (e.g. MinIO)Azure Blob StorageAzure Data Lake Storage Gen2Google Cloud StorageLocal file systempotentially any service supported by Apache OpenDAL. File Formats ParquetCSVJSONAvroORC Table Formats Delta LakeApache IcebergMaxCompute Schema 的集成要做一些聪明的事情。External Catalog 固然美好但增加了对外部系统的依赖压力大的情况下外部系统可能先挂。如果能提供一套快速创建、刷新 External Table 的方法也不失为一种好的解决方案。 参考 组件说明 ParadeDB is an Elasticsearch alternative built on Postgres. We’re modernizing the features of Elasticsearch’s product suite, starting with real-time search and analytics. pg_lakehouse is an extension that transforms Postgres into an analytical query engine over object stores like S3 and table formats like Delta Lake. Queries are pushed down to Apache DataFusion, which delivers excellent analytical performance. Combinations of the following object stores, table formats, and file formats are supported. DataFusion includes several built in data sources for common use cases, and can be extended by implementing the TableProvider trait. A TableProvider provides information for planning and an ExecutionPlans for execution. DataFusion Motivation Today, a vast amount of non-operational data — events, metrics, historical snapshots, vendor data, etc. — is ingested into data lakes like S3. Querying this data by moving it into a cloud data warehouse or operating a new query engine is expensive and time consuming. The goal of pg_lakehouse is to enable this data to be queried directly from Postgres. This eliminates the need for new infrastructure, loss of data freshness, data movement, and non-Postgres dialects of other query engines. . pg_lakehouse uses the foreign data wrapper (FDW) API to connect to any object store or table format and the executor hook API to push queries to DataFusion. While other FDWs like aws_s3 have existed in the Postgres extension ecosystem, these FDWs suffer from two limitations: . Lack of support for most object stores, file, and table formats Too slow over large datasets to be a viable analytical engine pg_lakehouse differentiates itself by supporting a wide breadth of stores and formats (thanks to OpenDAL) and by being very fast (thanks to DataFusion). FDW 工作原理 在 PostgreSQL 中外部数据包装器Foreign Data WrapperFDW允许一个 PostgreSQL 服务器访问外部数据源如另一个 SQL 或 NoSQL 数据库。FDW 的工作机制基于 SQL/MED (SQL Management of External Data) 标准这提供了一个框架来访问和管理存储在不同数据源中的数据。PostgreSQL FDW 如何工作主要包括以下步骤1. 加载和创建 FDW 扩展 第一步是在 PostgreSQL 数据库中加载和创建相应的 FDW 扩展。例如postgres_fdw 用于连接远程 PostgreSQL 服务器其他 FDW 如 mysql_fdw 用于 MySQL 数据库连接等。2. 定义外部服务器和用户映射 在 PostgreSQL 中指定外部数据源的详细信息比如服务器地址、端口、登录凭证等并为本地用户创建映射以授权远程数据访问。3. 创建外部表 定义外部表这些表代表远程数据源中的表。这个步骤将远程表的模式映射到 PostgreSQL 中来决定哪些列和数据类型将被访问。4. 查询外部表 当本地 PostgreSQL 服务器上的用户查询外部表时查询将被转发到 FDW。SQL 转化过程 当一个 SQL 查询是对一个外部表的操作时FDW 会接管这个查询并进行以下转换过程解析FDW 分析本地查询的结构这通常涉及解析 SQL 语句并理解所请求的目标数据、过滤条件、聚合操作和排序需求。转换然后FDW 会把本地 SQL 查询翻译或重写成远程数据库系统理解的方言。例如如果远程数据源是 MySQL 数据库postgres_fdw 会将 PostgreSQL SQL 查询转换为 MySQL 可以理解的 SQL 查询。执行转换过的查询被发送到远程数据库由远程数据库执行。结果获取查询结果从远程数据库返回到 PostgreSQL 服务器并在必要时进行进一步的处理例如如果一些请求在远程数据库上不能完成如某些类型的JOIN操作那么这些操作需要在返回结果之后由 PostgreSQL 本身完成。结果返回经处理的数据最终返回给客户端。这个过程的某些环节可能依赖特定的 FDW 实现。比如并非所有的查询条件和聚合操作都可以推送到所有类型的远程数据源进行处理。可能某些操作必须在本地 PostgreSQL 端完成这取决于 FDW 的功能和远程数据源的限制。FDW 的优势之一是它提供了一种透明的机制来访问外部数据使得外部数据源的表现形式与本地表非常相似使开发者能以统一的方式查询和操作数据。然而性能和功能上的限制要依赖于具体的 FDW 实现和外部数据源的能力。
http://www.hkea.cn/news/14573162/

相关文章:

  • 做网站需要每年交钱吗学校网站查询学历
  • 购物网站两化融合建设项目报告游戏是怎么做的视频网站
  • 国外用python做的网站网站的前端开发
  • 中山网站建设开发备案的网站换空间
  • 网站开发培训成都顺义哪里有做网站设计的
  • 谷歌生成在线网站地图wordpress激活邮件
  • 免费建网站平台访问国外网站速度慢
  • 台州企业网站搭建价格网站建设和注册
  • 东莞市专注网站建设品牌网页设计与制作课程教学痛点
  • 杭州高端网站设计公司互联网外包公司有哪些
  • 百度生成手机网站东莞微信网站建设信息
  • 网站权限配置如何制作简易个人网站
  • 网站问卷调查怎么做静态网站flash
  • 甘肃省省建设厅网站有创意的设计工作室名字
  • 上海好的高端网站建设大学做视频网站设计
  • 自建网站多少钱慈溪企业网站
  • 郑州建站地方同城网站开发
  • 免费网站正能量app应用大全重庆微信网站建设价格
  • 网站管理后台地址怎么查询南京关键词seo公司
  • 租房网站开发wordpress issingle
  • 网站建设、微信小程序、修改wordpress图标
  • 营销网站的例子互动网站建设多少钱
  • 湘潭做网站找磐石网络一流郑州百度推广托管
  • 网站建设相关费用2023年中国进入一级战备状态了吗
  • 哪个网站做二手叉车回收好js+下载服务器wordpress
  • 匿名聊天网站怎么做腾讯广告建站工具
  • 个人网站建设知乎做翻译兼职的网站
  • 成都网站建设低价wordpress媒体库只有2m
  • 资源站 wordpresswordpress修改主页模板
  • 贵南县公司网站建设2017网络公司排名