初学者中的帖子
辛普森悖论
- 21 九月 2024
辛普森悖论描述了一种情况,即在某个组内两个变量之间可能存在负相关关系,但当来自多个组的数据合并时,这种关系可能会消失甚至反转符号。下面的gif(来自辛普森悖论的维基百科页面)很好地展示了这一点。
辛普森悖论
- 21 九月 2024
辛普森悖论描述了一种情况,即在某个组内两个变量之间可能存在负相关关系,但当来自多个组的数据合并时,这种关系可能会消失甚至反转符号。下面的gif(来自辛普森悖论的维基百科页面)很好地展示了这一点。
辛普森悖论
- 21 九月 2024
辛普森悖论描述了一种情况,即在某个组内两个变量之间可能存在负相关关系,但当来自多个组的数据合并时,这种关系可能会消失甚至反转符号。下面的gif(来自辛普森悖论的维基百科页面)很好地展示了这一点。
辛普森悖论
- 21 九月 2024
辛普森悖论描述了一种情况,即在某个组内两个变量之间可能存在负相关关系,但当来自多个组的数据合并时,这种关系可能会消失甚至反转符号。下面的gif(来自辛普森悖论的维基百科页面)很好地展示了这一点。
广义线性模型:负二项回归
- 21 九月 2023
指令“include”:文件未找到:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/build/jupyter_execute/build/jupyter_execute/extra_installs.md’
广义线性模型:负二项回归
- 21 九月 2023
指令“include”:未找到文件:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/build/jupyter_execute/extra_installs.md’
GLM: 负二项回归
- 21 九月 2023
指令“include”:未找到文件:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/extra_installs.md’
干预分布与do操作符的图突变
- 21 七月 2023
PyMC 是开源贝叶斯统计生态系统中的一个关键组件。它每天都在帮助解决跨多个行业和学术研究领域的实际问题。并且它通过易于使用、功能强大且在解决贝叶斯统计推断问题方面具有实际用途而达到了这一实用水平。
干预分布与do操作符的图突变
- 21 七月 2023
PyMC 是开源贝叶斯统计生态系统中的一个关键组件。它每天都在帮助解决跨多个行业和学术研究领域的实际问题。并且它通过易于使用、功能强大且在解决贝叶斯统计推断问题方面具有实际用途而达到了这一实用水平。
干预分布与do算子的图突变
- 21 七月 2023
PyMC 是开源贝叶斯统计生态系统中的一个关键组件。它每天都在帮助解决跨多个行业和学术研究领域的实际问题。并且它通过易于使用、功能强大且在解决贝叶斯统计推断问题方面具有实际用途而达到了这一实用水平。
干预分布与do操作符的图突变
- 21 七月 2023
PyMC 是开源贝叶斯统计生态系统中的一个关键组件。它每天都在帮助解决跨多个行业和学术研究领域的实际问题。并且它通过易于使用、功能强大且在解决贝叶斯统计推断问题方面具有实际用途而达到了这一实用水平。
有序分类结果的回归模型
- 21 四月 2023
与统计学的许多领域一样,调查数据的语言也带有词汇过载的特点。在讨论调查设计时,您经常会听到关于基于设计和基于模型的方法之间的对比,这些方法涉及(i)抽样策略和(ii)对相关数据的统计推断。我们不会深入探讨不同的抽样策略,例如:简单随机抽样、整群随机抽样或使用人口加权方案的分层随机抽样。关于这些策略的文献非常丰富,但在本笔记本中,我们将讨论何时以及为什么将模型驱动的统计推断应用于Likert量表的调查响应数据和其他类型的有序分类数据是有用的。
有序分类结果的回归模型
- 21 四月 2023
与统计学的许多领域一样,调查数据的语言也带有词汇过载的特点。在讨论调查设计时,您经常会听到关于基于设计和基于模型的方法之间的对比,这些方法涉及(i)抽样策略和(ii)对相关数据的统计推断。我们不会深入探讨不同的抽样策略,例如:简单随机抽样、整群随机抽样或使用人口加权方案的分层随机抽样。关于这些策略的文献非常丰富,但在本笔记本中,我们将讨论何时以及为什么将模型驱动的统计推断应用于Likert量表的调查响应数据和其他类型的有序分类数据是有用的。
有序分类结果的回归模型
- 21 四月 2023
与统计学的许多领域一样,调查数据的语言也带有词汇过载的特点。在讨论调查设计时,您经常会听到关于基于设计和基于模型的方法之间的对比,这些方法涉及(i)抽样策略和(ii)对相关数据的统计推断。我们不会深入探讨不同的抽样策略,例如:简单随机抽样、整群随机抽样或使用人口加权方案的分层随机抽样。关于这些策略的文献非常丰富,但在本笔记本中,我们将讨论何时以及为什么将模型驱动的统计推断应用于Likert量表的调查响应数据和其他类型的有序分类数据是有用的。
有序分类结果的回归模型
- 21 四月 2023
与统计学的许多领域一样,调查数据的语言也带有词汇过载的特点。在讨论调查设计时,您经常会听到关于基于设计和基于模型的方法之间的对比,这些方法涉及(i)抽样策略和(ii)对相关数据的统计推断。我们不会深入探讨不同的抽样策略,例如:简单随机抽样、整群随机抽样或使用人口加权方案的分层随机抽样。关于这些策略的文献非常丰富,但在本笔记本中,我们将讨论何时以及为什么将模型驱动的统计推断应用于Likert量表的调查响应数据和其他类型的有序分类数据是有用的。
使用BART建模异方差性
- 21 一月 2023
在本笔记本中,我们展示了如何使用BART来建模异方差性,如pymc-bart
论文的第4.1节所述[Quiroga 等, 2022]。我们使用了R包datarium
提供的marketing
数据集[Kassambara, 2019]。其想法是将营销渠道对销售额的贡献建模为预算的函数。
使用BART建模异方差性
- 21 一月 2023
在本笔记本中,我们展示了如何使用BART来建模异方差性,如pymc-bart
论文的第4.1节所述[Quiroga 等, 2022]。我们使用了R包datarium
提供的marketing
数据集[Kassambara, 2019]。其想法是将营销渠道对销售的贡献建模为预算的函数。
使用BART建模异方差性
- 21 一月 2023
在本笔记本中,我们展示了如何使用BART来建模异方差性,如pymc-bart
论文的第4.1节所述[Quiroga 等, 2022]。我们使用了R包datarium
提供的marketing
数据集[Kassambara, 2019]。其想法是将营销渠道对销售额的贡献建模为预算的函数。
使用BART建模异方差性
- 21 一月 2023
在本笔记本中,我们展示了如何使用BART来建模异方差性,如pymc-bart
论文的第4.1节所述[Quiroga 等, 2022]。我们使用了R包datarium
提供的marketing
数据集[Kassambara, 2019]。其想法是将营销渠道对销售的贡献建模为预算的函数。
贝叶斯因子与边际似然
- 10 一月 2023
比较模型的“贝叶斯方法”是计算每个模型的边际似然 \(p(y \mid M_k)\),即给定模型\(M_k\)时观测数据\(y\)的概率。这个量,边际似然,只是贝叶斯定理的归一化常数。如果我们写出贝叶斯定理并明确所有推断都是模型依赖的,我们就可以看到这一点。
贝叶斯因子与边际似然
- 10 一月 2023
比较模型的“贝叶斯方法”是计算每个模型的边际似然 \(p(y \mid M_k)\),即给定模型\(M_k\)时观测数据\(y\)的概率。这个量,边际似然,只是贝叶斯定理的归一化常数。如果我们写出贝叶斯定理并明确所有推断都是模型依赖的,我们就可以看到这一点。
贝叶斯因子与边际似然
- 10 一月 2023
比较模型的“贝叶斯方法”是计算每个模型的边际似然 \(p(y \mid M_k)\),即给定模型\(M_k\)时观测数据\(y\)的概率。这个量,边际似然,只是贝叶斯定理的归一化常数。如果我们写出贝叶斯定理并明确所有推断都是模型依赖的,我们就可以看到这一点。
贝叶斯因子与边际似然
- 10 一月 2023
比较模型的“贝叶斯方法”是计算每个模型的边际似然 \(p(y \mid M_k)\),即给定模型\(M_k\)时观测数据\(y\)的概率。这个量,边际似然,只是贝叶斯定理的归一化常数。如果我们写出贝叶斯定理并明确所有推断都是模型依赖的,我们就可以看到这一点。
广义极值分布
- 27 九月 2022
广义极值(GEV)分布是一种包含Weibull、Gumbel和Frechet极值分布族的元分布。它用于建模平稳过程的极端值(最大值或最小值)的分布,例如年最大风速、桥梁上的年最大卡车重量等,而无需事先决定尾部行为。
广义极值分布
- 27 九月 2022
广义极值(GEV)分布是一种包含Weibull、Gumbel和Frechet极值分布族的元分布。它用于建模平稳过程的极端值(最大值或最小值)的分布,例如年最大风速、桥梁上的年最大卡车重量等,而无需事先决定尾部行为。
广义极值分布
- 27 九月 2022
广义极值(GEV)分布是一种包含Weibull、Gumbel和Frechet极值分布族的元分布。它用于建模平稳过程的极值(最大值或最小值)的分布,例如年最大风速、桥梁上的年最大卡车重量等,而无需事先决定尾部行为。
广义极值分布
- 27 九月 2022
广义极值(GEV)分布是一种包含Weibull、Gumbel和Frechet极值分布族的元分布。它用于建模平稳过程的极值(最大值或最小值)的分布,例如年最大风速、桥梁上的年最大卡车重量等,而无需事先决定尾部行为。
空间数据的条件自回归(CAR)模型
- 29 七月 2022
指令“include”:文件未找到:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/build/jupyter_execute/build/jupyter_execute/extra_installs.md’
空间数据的条件自回归(CAR)模型
- 29 七月 2022
指令“include”:未找到文件:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/build/jupyter_execute/extra_installs.md’
空间数据的条件自回归(CAR)模型
- 29 七月 2022
指令“include”:未找到文件:‘/Users/cw/baidu/code/fin_tool/github/pymc-examples/examples/build/jupyter_execute/extra_installs.md’
随机波动率模型
- 17 六月 2022
资产价格具有时变波动性(日收益率的方差)。在某些时期,收益率变化很大,而在其他时期则非常稳定。随机波动模型通过一个潜在的波动变量来建模,该变量被建模为随机过程。以下模型类似于No-U-Turn Sampler论文中描述的模型,[Hoffman和Gelman,2014]。
随机波动率模型
- 17 六月 2022
资产价格具有时变波动性(日收益率的方差)。在某些时期,收益率变化很大,而在其他时期则非常稳定。随机波动率模型通过一个潜在的波动率变量来建模,该变量被建模为一个随机过程。以下模型类似于No-U-Turn Sampler论文中描述的模型,[Hoffman和Gelman,2014]。
样条
- 04 六月 2022
通常,我们想要拟合的模型并不是在某些\(x\)和\(y\)之间的一条完美直线。 相反,模型的参数预计会在\(x\)上变化。 有多种方法可以处理这种情况,其中之一是拟合一个样条。 样条拟合实际上是多个单独曲线(分段多项式)的和,每个曲线拟合\(x\)的不同部分,并在它们的边界处连接在一起,这些边界通常称为节点。
样条
- 04 六月 2022
通常,我们想要拟合的模型并不是在某些\(x\)和\(y\)之间的一条完美直线。 相反,模型的参数预计会随着\(x\)的变化而变化。 有多种方法可以处理这种情况,其中之一是拟合一个样条。 样条拟合实际上是多个单独曲线(分段多项式)的和,每个曲线拟合\(x\)的不同部分,并在它们的边界处连接在一起,这些边界通常称为节点。
样条
- 04 六月 2022
通常,我们想要拟合的模型并不是在某些\(x\)和\(y\)之间的一条完美直线。 相反,模型的参数预计会在\(x\)上变化。 有多种方法可以处理这种情况,其中之一是拟合一个样条。 样条拟合实际上是多个单独曲线(分段多项式)的和,每个曲线拟合\(x\)的不同部分,并在它们的边界处连接在一起,这些边界通常称为节点。
样条
- 04 六月 2022
通常,我们想要拟合的模型并不是在某些\(x\)和\(y\)之间的一条完美直线。 相反,模型的参数预计会随着\(x\)的变化而变化。 有多种方法可以处理这种情况,其中之一是拟合一个样条。 样条拟合实际上是多个单独曲线(分段多项式)的和,每个曲线拟合\(x\)的不同部分,并在它们的边界处连接在一起,这些边界通常称为节点。
通用 API 快速入门
- 31 五月 2022
PyMC中的模型围绕Model
类展开。它包含所有随机变量(RVs)的引用,并计算模型的对数概率及其梯度。通常,您会将其作为with
上下文的一部分进行实例化:
通用 API 快速入门
- 31 五月 2022
PyMC中的模型围绕Model
类展开。它包含所有随机变量(RVs)的引用,并计算模型的对数概率及其梯度。通常,您会将其作为with
上下文的一部分进行实例化:
通用 API 快速入门
- 31 五月 2022
PyMC中的模型围绕Model
类展开。它包含所有随机变量(RVs)的引用,并计算模型的对数概率及其梯度。通常,您会将其作为with
上下文的一部分进行实例化:
通用 API 快速入门
- 31 五月 2022
PyMC中的模型围绕Model
类展开。它包含所有随机变量(RVs)的引用,并计算模型的对数概率及其梯度。通常,您会将其作为with
上下文的一部分进行实例化:
近似贝叶斯计算
- 31 五月 2022
近似贝叶斯计算方法(也称为似然自由推断方法),是一组为在似然函数难以处理或计算成本高的情况下推断后验分布而开发的技术。这并不意味着似然函数不是分析的一部分,只是我们在近似似然函数,因此得名ABC方法。
近似贝叶斯计算
- 31 五月 2022
近似贝叶斯计算方法(也称为似然自由推断方法),是一组为在似然函数难以处理或计算成本高的情况下推断后验分布而开发的技术。这并不意味着似然函数不是分析的一部分,只是我们在近似似然函数,因此得名ABC方法。
近似贝叶斯计算
- 31 五月 2022
近似贝叶斯计算方法(也称为似然自由推断方法),是一组为在似然函数难以处理或计算成本高的情况下推断后验分布而开发的技术。这并不意味着似然函数不是分析的一部分,只是我们在近似似然函数,因此得名ABC方法。
近似贝叶斯计算
- 31 五月 2022
近似贝叶斯计算方法(也称为似然自由推断方法),是一组为在似然函数难以处理或计算成本高的情况下推断后验分布而开发的技术。这并不意味着似然函数不是分析的一部分,只是我们在近似似然函数,因此得名ABC方法。
断点回归设计分析
- 21 四月 2022
准实验涉及实验干预和定量测量。然而,准实验不涉及将单位(例如细胞、人、公司、学校、州)随机分配到测试组或对照组。这种无法进行随机分配的情况在提出因果关系声明时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预而不是由于混杂因素造成的。
断点回归设计分析
- 21 四月 2022
准实验涉及实验干预和定量测量。然而,准实验不涉及将单位(例如细胞、人、公司、学校、州)随机分配到测试组或对照组。这种无法进行随机分配的情况在提出因果关系声明时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预而不是由于混杂因素造成的。
断点回归设计分析
- 21 四月 2022
准实验涉及实验干预和定量测量。然而,准实验不涉及将单位(例如细胞、人、公司、学校、州)随机分配到测试组或对照组。这种无法进行随机分配的情况在提出因果关系声明时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预而不是由于混杂因素造成的。
回归不连续设计分析
- 21 四月 2022
准实验涉及实验干预和定量测量。然而,准实验不涉及将单位(例如细胞、人、公司、学校、州)随机分配到测试组或对照组。这种无法进行随机分配的情况在提出因果关系声明时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预而不是由于混杂因素造成的。
贝叶斯调节分析
- 21 三月 2022
本笔记本涵盖了贝叶斯调节分析。当我们认为一个预测变量(调节变量)可能影响另一个预测变量与结果之间的线性关系时,这是合适的。这里我们看一个例子,研究训练小时数与肌肉质量之间的关系,其中可能年龄(调节变量)会影响这种关系。
贝叶斯调节分析
- 21 三月 2022
本笔记本涵盖了贝叶斯调节分析。当我们认为一个预测变量(调节变量)可能影响另一个预测变量与结果之间的线性关系时,这是合适的。这里我们看一个例子,研究训练小时数与肌肉质量之间的关系,其中可能年龄(调节变量)会影响这种关系。
贝叶斯调节分析
- 21 三月 2022
本笔记本涵盖了贝叶斯调节分析。当我们认为一个预测变量(调节变量)可能影响另一个预测变量与结果之间的线性关系时,这是合适的。这里我们看一个例子,研究训练小时数与肌肉质量之间的关系,其中可能年龄(调节变量)会影响这种关系。
贝叶斯调节分析
- 21 三月 2022
本笔记本涵盖了贝叶斯调节分析。当我们认为一个预测变量(调节变量)可能影响另一个预测变量与结果之间的线性关系时,这是合适的。这里我们看一个例子,研究训练小时数与肌肉质量之间的关系,其中可能年龄(调节变量)会影响这种关系。
使用块更新的Lasso回归
- 10 二月 2022
有时,一起更新一组参数非常有用。例如,高度相关的变量通常适合一起更新。在 PyMC 中,块更新很简单。这将在使用 pymc.sample
的参数 step
时进行演示。
使用块更新的Lasso回归
- 10 二月 2022
有时,一起更新一组参数非常有用。例如,高度相关的变量通常适合一起更新。在 PyMC 中,块更新很简单。这将在使用 pymc.sample
的参数 step
时进行演示。
使用块更新的Lasso回归
- 10 二月 2022
有时,一起更新一组参数非常有用。例如,高度相关的变量通常适合一起更新。在 PyMC 中,块更新很简单。这将在使用 pymc.sample
的参数 step
时进行演示。
使用块更新的Lasso回归
- 10 二月 2022
有时,一起更新一组参数非常有用。例如,高度相关的变量通常适合一起更新。在 PyMC 中,块更新很简单。这将在使用 pymc.sample
的参数 step
时进行演示。
使用数据容器
- 16 十二月 2021
在构建了你梦想中的统计模型之后,你需要给它提供一些数据。数据通常以两种方式之一引入PyMC模型。一些数据用作外生输入,在线性回归模型中称为X
,其中mu = X @ beta
。其他数据是模型内生输出的“观察”示例,在回归模型中称为y
,并作为输入用于模型隐含的似然函数。这些数据,无论是外生的还是内生的,都可以以多种数据类型包含在你的模型中,包括numpy ndarrays
、pandas Series
和DataFrame
,甚至pytensor TensorVariables
。
使用数据容器
- 16 十二月 2021
在构建了你梦想中的统计模型之后,你需要给它提供一些数据。数据通常以两种方式之一引入PyMC模型。一些数据用作外生输入,在线性回归模型中称为X
,其中mu = X @ beta
。其他数据是模型内生输出的“观察”示例,在回归模型中称为y
,并作为输入用于模型隐含的似然函数。这些数据,无论是外生的还是内生的,都可以以多种数据类型包含在你的模型中,包括numpy ndarrays
、pandas Series
和DataFrame
,甚至pytensor TensorVariables
。
使用数据容器
- 16 十二月 2021
在构建了你梦想中的统计模型之后,你需要给它提供一些数据。数据通常以两种方式之一引入PyMC模型。一些数据用作外生输入,在线性回归模型中称为X
,其中mu = X @ beta
。其他数据是模型内生输出的“观察”示例,在回归模型中称为y
,并作为输入用于模型隐含的似然函数。这些数据,无论是外生的还是内生的,都可以以多种数据类型包含在你的模型中,包括numpy ndarrays
、pandas Series
和DataFrame
,甚至pytensor TensorVariables
。
使用数据容器
- 16 十二月 2021
在构建了你梦想中的统计模型之后,你需要给它提供一些数据。数据通常以两种方式之一引入PyMC模型。一些数据用作外生输入,在线性回归模型中称为X
,其中mu = X @ beta
。其他数据是模型内生输出的“观察”示例,在回归模型中称为y
,并作为输入用于模型隐含的似然函数。这些数据,无论是外生的还是内生的,都可以以多种数据类型包含在你的模型中,包括numpy ndarrays
、pandas Series
和DataFrame
,甚至pytensor TensorVariables
。
顺序蒙特卡罗
- 19 十月 2021
使用标准的MCMC方法从具有多个峰值的分布中采样可能会很困难,甚至是不可能的,因为马尔可夫链通常会卡在其中一个最小值中。顺序蒙特卡罗采样器(SMC)是解决这个问题的一种方法。
顺序蒙特卡罗
- 19 十月 2021
使用标准的MCMC方法从具有多个峰值的分布中采样可能会很困难,甚至是不可能的,因为马尔可夫链通常会卡在其中一个最小值中。顺序蒙特卡罗采样器(SMC)是解决这个问题的一种方法。
顺序蒙特卡罗
- 19 十月 2021
使用标准的MCMC方法从具有多个峰值的分布中采样可能会很困难,甚至是不可能的,因为马尔可夫链通常会卡在其中一个最小值中。顺序蒙特卡罗采样器(SMC)是解决这个问题的一种方法。
顺序蒙特卡罗
- 19 十月 2021
使用标准的MCMC方法从具有多个峰值的分布中采样可能会很困难,甚至是不可能的,因为马尔可夫链通常会卡在其中一个最小值中。顺序蒙特卡罗采样器(SMC)是解决这个问题的一种方法。
贝叶斯A/B测试简介
- 23 五月 2021
本笔记本演示了如何实现A/B测试的贝叶斯分析。我们实现了VWO的贝叶斯A/B测试白皮书中讨论的模型[Stucchio, 2015],并讨论了这些模型中不同先验选择的影响。本笔记本不讨论其他相关主题,如如何选择先验、早期停止和功效分析。
贝叶斯A/B测试简介
- 23 五月 2021
本笔记本演示了如何实现A/B测试的贝叶斯分析。我们实现了VWO的贝叶斯A/B测试白皮书中讨论的模型[Stucchio, 2015],并讨论了这些模型中不同先验选择的影响。本笔记本不讨论其他相关主题,如如何选择先验、早期停止和功效分析。
贝叶斯A/B测试简介
- 23 五月 2021
本笔记本演示了如何实现A/B测试的贝叶斯分析。我们实现了VWO的贝叶斯A/B测试白皮书中讨论的模型[Stucchio, 2015],并讨论了这些模型中不同先验选择的影响。本笔记本不讨论其他相关主题,如如何选择先验、早期停止和功效分析。
贝叶斯A/B测试简介
- 23 五月 2021
本笔记本演示了如何实现A/B测试的贝叶斯分析。我们实现了VWO的贝叶斯A/B测试白皮书中讨论的模型[Stucchio, 2015],并讨论了这些模型中不同先验选择的影响。本笔记本不讨论其他相关主题,如如何选择先验、早期停止和功效分析。