Hilda

「离开世界之前 一切都是过程」

numpy-形状操作

1.什么是广播 在 NumPy 中,广播(Broadcasting)是一种强大的机制,它允许在形状不同的数组之间执行算术运算(如加、减、乘、除等)。当两个数组的形状不完全相同时,NumPy 会尝试通过“扩展”较小数组的维度来使其与较大数组的形状兼容,从而无需显式地复制数据。这极大地简化了代码,并提高了计算效率。 广播是 NumPy 在执行算术运算时处理具有不同形状的数组的一种方式。它...

numpy-形状操作

1.数组变形 数组变形是指改变数组的维度(shape),同时保持其数据不变。这是 NumPy 中一个非常常见的操作,允许您将数据以不同的组织形式进行处理。 ndarray.reshape(new_shape) 方法: 这是最常用的变形方法。它返回一个具有新形状的数组,但通常不复制数据,而是创建一个原始数组的视图。只有当新旧形状的数据存储方式不兼容时(例...

numpy-索引 花式索引 切片 布尔值索引

1.基本索引和切片 基本索引和切片是 NumPy 中访问数组元素的最常见方式,类似于 Python 列表的索引和切片,但功能更强大,尤其是在多维数组中。 (1)一维数组 对于一维数组,基本索引和切片与 Python 列表非常相似: 索引单个元素: 使用方括号 [] 和一个整数索引来访问单个元素。索引从 0 开始。负数索引表示从数组末尾开始计数(-1 是最后一个元素)。 ...

numpy-深拷贝与视图

1.完全没有复制(引用赋值) 当将一个 NumPy 数组直接赋值给另一个变量时,实际上并没有创建一个新的数组对象,而是创建了一个指向相同内存地址的新引用。这意味着两个变量现在都指向内存中的同一个 NumPy 数组对象。它们是“命运共同体”,对其中任何一个变量所代表的数组进行的修改,都会立即反映在另一个变量上,因为它们操作的是同一块数据。 这种行为与 Python 中可变对象的默认赋值...

numpy-数组运算

1.加减乘除幂 NumPy 数组之间的加减乘除和幂运算默认执行元素级 (element-wise) 操作。这意味着对应位置的元素会进行相应的数学运算,并返回一个新的 ndarray。这些操作是 NumPy 向量化能力的核心体现。 加法 (+): arr1 + arr2,对应位置的元素相加。 减法 (-): arr1 - arr2,对应位置的元素相减。 乘法 (\): arr1 *...

numpy初级2-基本操作

1.ndarray 的数据类型 NumPy ndarray 中的所有元素都必须是相同的数据类型(dtype)。这种固定类型的设计是 NumPy 实现高性能数值计算的基础。NumPy 提供了比 Python 内置类型更丰富、更精确的数值数据类型,包括不同位宽的整数、浮点数,以及布尔值、复数和字符串等。 Python 的列表可以存储不同类型的数据(例如 [1, "hello", 3.14...

numpy初级1-基本操作

NumPy 是 Python 的数值计算扩展,提供高效多维数组和掩码数组,支持矩阵运算、随机数生成和数学函数。掩码数组处理缺失数据,np.save 保存单一数组为 .npy 文件,np.savez 保存多数组为压缩 .npz 文件,适合高效存储和加载。

1.Numpy介绍 NumPy(Numerical Python)是Python的一种开源的数值计算扩展。提供多维数组对象,各种派生对象(如掩码数组和矩阵),这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学...

python爬虫基础02-爬虫开发基础

HTTP/HTTPS是网络协议,HTTP无状态,HTTPS加密安全。URL是URI子集,包含协议、主机等。爬虫需模拟HTTP请求,处理Cookie和Session,解析JSON数据,分析AJAX动态内容,推荐用Chrome DevTools和requests库。

推荐一个json的在线解析器:json.cn 1、HTTP与HTTPS (1)HTTP HTTP (HyperText Transfer Protocol):超文本传输协议,是互联网上应用最为广泛的一种网络协议。它是一个基于请求与响应模式的、无状态的应用层协议,常用于传输超文本(如HTML)、图片、视频等资源。 ● 无状态 (Stateless):HTTP 协议是无状态的,这意味...

python爬虫基础01-初识爬虫

数据来源包括互联网、企业、传感器、政府及第三方,广泛应用于商业、科研、治理等。网络爬虫自动抓取互联网信息,分为通用、聚焦等类型。Python因其简洁语法、丰富库、高效开发,成为爬虫首选语言

1.数据的来源及作用 在当今的数字化时代,数据无处不在,其来源非常广泛,主要可以分为以下几类: 互联网公开数据: 这是最常见的来源,包括网站上的文本、图片、视频、商品信息、新闻文章、社交媒体帖子、论坛讨论、公开API接口返回的数据等。这些数据通常可以通过网络爬虫直接获取。 图中是百度指数关于java和golang语言的对比,无论是其底层的数据收集方式(搜索引擎...

python基础-文件操作和目录管理

字符编码将字符转为二进制,常见格式包括ASCII、Unicode(UTF-8、UTF-16、UTF-32)、GBK等。文件读写通过操作系统句柄、缓冲区操作,支持文本/二进制模式。Python的open()函数、with语句、os模块实现文件和目录操作

1、编码格式介绍 字符编码是将字符(如字母、数字、符号)转换为计算机可以存储和处理的二进制数据(字节)的过程。常见的编码格式包括ASCII、Unicode(及其实现UTF-8、UTF-16等)。理解编码对于正确处理文本数据至关重要。 计算机只能理解二进制数据(0和1)。当我们处理文本时,需要一种方式将人类可读的字符映射到这些二进制数据上。这就是字符编码的作用。 ASCII:最早...