网站搜索功能如何实现,做外贸哪个英文网站好,凡科建站网站建设,网站门户建设方案1、数值型缺失值用中位数补充#xff0c;分类数据用众数补充。
2、偏态系数1就是高度偏#xff0c;0.5到1是中度。
3、分布和检验
在 t检验之前进行 F检验的目的是确保 t检验的方差齐性假设成立。如果 F检验结果显示方差不相等#xff0c;则需要切换到调整后的 t 检验…1、数值型缺失值用中位数补充分类数据用众数补充。
2、偏态系数1就是高度偏0.5到1是中度。
3、分布和检验
在 t检验之前进行 F检验的目的是确保 t检验的方差齐性假设成立。如果 F检验结果显示方差不相等则需要切换到调整后的 t 检验Welch t检验以获得更准确的分析结果。
分布类型常用检验方法适用场景正态分布正态性检验判断数据分布形式作为后续分析前提卡方分布卡方检验、方差检验分析分类数据的独立性或分布拟合优度t分布t检验小样本均值比较数据需服从正态分布F分布方差分析ANOVA、回归方程的显著性检验多组数据均值比较数据需服从正态分布
均值
t检验是样本均值检验比较均值差异。
z检验用于大样本样本量 30或已知总体标准差的情况。例如比较城市居民的平均收入是否达到全国平均水平。
方差
F检验比较两个样本的方差是否相等、是用于判断t检验的前提所以F在t前。
方差分析检验用于比较三个及以上组的均值是否相等。例如不同城市对某商品满意度的差异。
Pearson相关性检验
用于检验两个变量是否呈线性相关适用于正态分布的数据。
Spearman秩相关性检验
替代Pearson相关性检验用于非正态分布数据或等级数据。
分布
卡方分布检验
用于离散型数据检验实际分布与理论分布是否一致。例如检验某调查数据与预期比例的吻合程度。
分类
卡方检验Chi-square test
检验分类变量之间的独立性。例如分析性别与购物偏好是否相关。
4、箱线图 从小到大排列
Q1代表1/4分位点Q3代表3/4分位点Q1Q3。
中位数在Q1和Q3之间Q3-Q11QR其中Q1-1.51QR 为下限
Q31.51QR为上限。
5、销售一般用目标比和同环比。
6、库销比反应进销存的流转速度进而反映资金利用率。
7、SPU和SKU
SPUStandard Product Unit标准产品单元可以理解为一个产品型号比如上面图片看到的iPhone 14 (A2884) 就是一个标准的产品单元它属于生产制造过程的一个标准品标准品在缺乏具体规格信息的时候是不能直接售卖的除非这个产品系列只有一个规格。
SKUStock Keeping Unit最小库存单元也就是对应仓库中的一件商品这个商品的规格信息在入库的时候就已经确定了的因此是可以直接售卖的。
SPU 和 SKU 的关系SPU 是一个相对抽象的概念而SKU 是具象化的 SPU也就是在 SPU 基础上添加了一个可售卖完整的规格信息从而能够让顾客明确知道拿到手的商品是什么样。以服装为例服装的一个款式是一个 SPU只有加上了尺码、颜色后才能成为一个 SKU。、
8、波士顿矩形又称为 BCG矩阵Boston Consulting Group Matrix。
明星Stars 特点高市场增长率 高市场份额。策略投资支持继续扩大市场占有率但需大量资金投入。例子快速增长的主流产品或市场占主导地位的创新业务。 金牛Cash Cows 特点低市场增长率 高市场份额。策略维持现状收割利润支持其他业务发展。例子成熟市场中的核心盈利产品。 问题Question Marks 特点高市场增长率 低市场份额。策略选择性投资找到有潜力的业务转化为明星否则放弃。例子新兴但竞争激烈的市场业务。 瘦狗Dogs 特点低市场增长率 低市场份额。策略减少投资甚至退出避免资源浪费。例子市场边缘产品或夕阳产业。
9、统计图表不能用维度字段作为横坐标。
10、BI报表在设计阶段是把业务转为维度和度量的过程。
11、峰度 0是正态分布。
12、总订单平均值要计算非重复订单。
13、AARRR模型获取、激活、留存、获益提高客单价付费转化率Revenue、传播
14、ARPUAverage Revenue Per User 平均用户收入总收入/活跃用户数量
、CRMCustomer Relationship Management 客户关系管理重点在于提升客户满意度与忠诚度并最终实现收益增长。
、CVMCustomer Value Management 客户价值管理强调通过分析客户的生命周期价值CLV Customer Lifetime Value 优化与客户的互动主要关注客户的长期收益贡献。
15、DML语言
-- 修改字段名
ALTER TABLE table_name
RENAME COLUMN old_column_name TO new_column_name;
-- 添加字段
ALTER TABLE employees
ADD hire_date DATE;
--删除字段
ALTER TABLE table_name
DROP COLUMN column_name;
ALTER TABLE employees
DROP COLUMN hire_date;-- 修改表名
ALTER TABLE employees
RENAME TO staff;-- 添加主键
ALTER TABLE employees
ADD PRIMARY KEY (employee_id);
-- 删除主键
ALTER TABLE employees
DROP PRIMARY KEY;
-- 语句更改字段属性或位置时至少需要指定字段名字段的数据类型
ALTER TABLE employees
MODIFY salary INT AFTER age;16、线性相关的强度
r协方差 / 标准差的乘积
非常强的相关性 r 的绝对值接近 1即 r 在 0.8 到 1.0 或 -0.8 到 -1.0 之间表示非常强的线性关系。 强相关性 r 的绝对值在 0.6 到 0.8 之间表示强的线性关系。 中等程度的相关性 r的绝对值在 0.3 到 0.6 之间表示中等程度的线性关系。 弱相关性 r的绝对值在 0.1 到 0.3 之间表示弱的线性关系。 非常弱的相关性或无相关性 r的绝对值小于 0.1 通常被认为是非常弱的相关性或没有线性相关。
17、浏览量PV是对店铺内所有页面的总浏览量而访问数visitsession数是用户到达店铺或者平台到离开的一次完整访问跳失次数表示用户进入首页没有下一步操作就离开的次数。
UV 访客数 是独立访问数
跳失率 跳失次数/访问数
平均访问深度 浏览量/访问数
18、ARPU用户平均收入Average Revenue Per User 总收入/总用户数。
19、CAC用户获取成本Customer Acquisition Cost 。
20、费用支付核算方式
CPM Mille 千次曝光CPS Sales 实际销售CPC Click 点击收费
21、表格结构数据的函数组成部分操作符、函数表达式、参数、返回值。
22、空值是空白值的简称。
23、漏斗模型需要关注体型、流速、体量。
24、数据驱动业务以经验为主经验比数据更加可信。
25、BI报表和业务分析报告的区别主要是
侧重业务面的完整叙述动态信息以表格图表为主基于多源数据