利用Python和简化方法进行高效的基本面股票分析,在瞬息万变的股票市场中占据优势。本文将深入探讨如何运用Python及自定义模块(例如yfinance3)构建自动化工具,实现股票基本面分析。我们将逐步拆解代码,并阐明每个部分如何有效地收集和处理股票数据。
项目核心功能:
项目结构:
.
├── data/
│ ├── datasets/
│ └── sources/
│ └── index/
│ └── stocklist.csv
└── main.py
代码详解:
data_path = './data/datasets'
csv_base_path = './data/sources/index/'
这些路径指定了存储包含股票代码的CSV文件的位置,以及处理后数据的保存位置。
if not os.path.exists(csv_base_path):
st.error(f"directory not found: {csv_base_path}")
else:
csv_files = [file for file in os.listdir(csv_base_path) if file.endswith('.csv')]
selected_csv = st.selectbox("choose a csv file:", csv_files)
这段代码检查目录是否存在,并使用可用的CSV文件填充下拉菜单,允许用户选择包含股票代码的文件。
for symbol in symbols:
file_name = os.path.join(folder_path, f'{symbol}.json')
if os.path.exists(file_name):
existing_files += 1
continue
try:
data = yfinance3(symbol)
with open(file_name, 'w') as file:
json.dump(data.info, file)
new_downloads += 1
except exception as e:
st.error(f"error processing {symbol}: {e}")
这段代码迭代股票代码,使用yfinance3模块下载数据,并以JSON格式保存。它跟踪现有文件、新下载的文件,并报告错误。
def load_data(json_data):
data['symbol'].append(json_data.get('symbol', np.nan))
data['name'].append(json_data.get('longname', np.nan))
data['industry'].append(json_data.get('industry', np.nan))
...
load_data
函数从JSON文件中提取关键财务指标,例如:
提取的数据将添加到结构化的字典中。
df = pd.DataFrame(data)
df_exceptions = df[df.isna().any(axis=1)]
df = df.dropna().reset_index(drop=True)
这段代码从提取的数据创建Pandas DataFrame,删除包含缺失值的行(并记录这些异常情况以供用户审查)。
df['52w range'] = ((df['price'] - df['52w low']) / (df['52w high'] - df['52w low'])) * 100
此计算有助于评估股票在其52周交易区间中的位置。
st.write("### Processed Data", df)
output_file = os.path.join(folder_path, 'processed_data.csv')
df.to_csv(output_file, index=False)
st.success(f"Processed data saved to {output_file}")
处理后的数据以清晰的方式显示,并保存为CSV文件,方便日后参考。
示例输出:
潜在的改进方向:
结论:
本项目提供了一种强大且简便的方法,利用Python和简化技术进行股票基本面分析。它能自动化数据收集、处理和展示,帮助投资者做出更明智的投资决策。
欢迎提出改进建议或添加新功能!