• Databend 开源周报第 110 期


     Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务https://app.databend.cn 。

    What's On In Databend

    探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

    使用 BendSQL 管理 Stage 中的文件

    Databend 推荐使用 PRESIGN 来将文件上传到 stage 中或者将文件下载到本地。PRESIGN 会生成一个带有时间限制的预签名 URL ,提供了一种安全高效的数据传输方式,并且减少文件传输的延迟。

    对于 BendSQL 客户端的用户而言,可以利用 PUT 命令将文件上传到 Stage 并使用 GET 命令下载 Stage 中的文件。

    1. root@localhost:8000/default> PUT fs:///books.parquet @~
    2. PUT fs:///books.parquet @~
    3. ┌───────────────────────────────────────────────┐
    4. filestatus
    5. StringString
    6. ├─────────────────────────────────────┼─────────┤
    7. /books.parquet │ SUCCESS │
    8. └───────────────────────────────────────────────┘
    9. GET @~/ fs:///fromStage/
    10. ┌─────────────────────────────────────────────────────────┐
    11. filestatus
    12. StringString
    13. ├───────────────────────────────────────────────┼─────────┤
    14. /fromStage/books.parquet │ SUCCESS │
    15. └─────────────────────────────────────────────────────────┘

    如果您想了解更多信息,请查看下面列出的资源。

    Code Corner

    一起来探索 Databend 和周边生态中的代码片段或项目。

    在 Jupyter Notebook 中使用 Databend Python Binding

    Databend 提供 Python Binding ,无需部署 Databend 实例即可使用,DataFrame 也可以自由转换到 Polars 和 Pandas 格式,方便和数据科学工具集成使用。

    只需要执行下面的命令安装即可:

    pip install databend

    下面的程序展示了如何在 Jupyter Notebook 中使用 Databend Python Binding ,并利用 matplotlib 绘制条形图。

    1. # Create a table in DataBend
    2. ctx.sql("CREATE TABLE IF NOT EXISTS user (created_at Date, count Int32)")
    3. # Create a table in DataBend
    4. ctx.sql("CREATE TABLE IF NOT EXISTS user (created_at Date, count Int32)")
    5. # Insert multiple rows of data into the table
    6. ctx.sql("INSERT INTO user VALUES ('2022-04-01', 5), ('2022-04-01', 3), ('2022-04-03', 4), ('2022-04-03', 1), ('2022-04-04', 10)")
    7. # Execute a query
    8. result = ctx.sql("SELECT created_at as date, count(*) as count FROM user GROUP BY created_at")
    9. # Display the query result
    10. result.show()
    11. # Import libraries for data visualization
    12. import matplotlib.pyplot as plt
    13. # Convert the query result to a Pandas DataFrame
    14. df = result.to_pandas()
    15. # Create a bar chart to visualize the data
    16. df.plot.bar(x='date', y='count')
    17. plt.show()

    如果您想了解更多信息,请查看下面列出的资源。

    Highlights

    以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

    What's Up Next

    我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

    支持使用 JavaScript 创建 UDF

    PR #12729 | feat: implement udf server in databend 预计会在本周进行合并。这意味着 Databend 即将支持使用 Python 创建用户自定义函数。

    CREATE FUNCTION [IF NOT EXISTS] <udf_name> (<arg_type>, ...) RETURNS <return_type> LANGUAGE <language> HANDLER=<handler> ADDRESS=<udf_server_address>

    我们期望在这个 PR 的基础上提供对多种语言 UDF 的支持,JavaScript 可能是值得尝试的选项之一。

    Issue #12746 | Feature: support javascript udf 

    如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

    Changelog

    前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

    地址:https://github.com/datafuselabs/databend/releases

    Contributors

    非常感谢贡献者们在本周的卓越工作。

    Connect With Us

    Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • 相关阅读:
    调试九法准则
    替换文章中的关键词
    前端项目中,强缓存和协商缓存的配置
    Oracle/PLSQL: Avg Function
    兴业数金一面
    七夕表白网页效果实现与解析
    Flutter 下载篇 - 贰 | 当下载器遇上切换网络库
    Windows下点击startup.bat启动tomcat出现乱码
    1、【开始】【简介】Qlib:量化平台
    Qt开发_调用OpenCV(3.4.7)设计完成人脸检测系统
  • 原文地址:https://blog.csdn.net/Databend/article/details/132838339