REDLINE - Financial Data Conversion & Management Tool

REDLINE is a powerful data conversion tool that transforms financial market data files (especially Stooq format) into machine learning-ready formats with a user-friendly GUI interface.

🎯 Core Purpose

REDLINE specializes in converting, cleaning, and managing financial market data for machine learning and data analysis workflows. It provides both GUI and command-line interfaces for processing large datasets efficiently.

📁 Supported File Formats

Input Formats

CSV (.csv) - Comma-separated values
TXT (.txt) - Text files (including Stooq format)
JSON (.json) - JavaScript Object Notation
DuckDB (.duckdb) - Embedded analytical database
Parquet (.parquet) - Columnar storage format
Feather (.feather) - Fast binary format
Keras (.h5) - TensorFlow/Keras model files
NumPy (.npz) - NumPy compressed arrays

Output Formats

CSV - Standard comma-separated values
JSON - JavaScript Object Notation
DuckDB - Embedded analytical database
Parquet - Columnar storage format
Feather - Fast binary format
HDF5 - Hierarchical Data Format
Pickle - Python serialization format

🖥️ GUI Interface Features

Main Application Window

1200x800 minimum window size
Main toolbar with quick access buttons
Tabbed interface for organized workflow
Performance monitoring with real-time memory usage

Data Loader Tab

File Selection
- Browse and select multiple files
- Select All/Deselect All functionality
- File format auto-detection
- Selection counter display
Format Configuration
- Input format selection (CSV, TXT, JSON, DuckDB, etc.)
- Output format selection
- Date range filtering (start/end dates)
- Data balancing options (target/minimum records per ticker)
Data Processing Actions
- Preview File - View file contents before processing
- Preprocess File - Clean and normalize data
- Merge/Consolidate Files - Combine multiple files
- Analyze Selected - Analyze file structure and content
Progress Tracking
- Progress bar for batch operations
- Background processing with threading
- Real-time status updates

Data View Tab

File Browser
- Hierarchical file listing
- Multiple file selection
- File status indicators
- Refresh functionality
Data Viewer
- TreeView display with sortable columns
- Pagination controls (50, 100, 200, 500, 1000 rows per page)
- Ticker navigation (Previous/Next ticker buttons)
- Global search with case-sensitive option
- Column filtering for each data column
Advanced Features
- Virtual Scrolling for large datasets (10M+ rows)
- Advanced Filtering with SQL-like query builder
- Memory optimization with automatic garbage collection
- Performance monitoring with real-time memory usage
Data Management
- Export data (current page or all data)
- Remove files from storage
- Show statistics for data analysis
- Copy data to clipboard

🔧 Data Processing Capabilities

Data Validation

Schema validation for required columns
Stooq format detection and parsing
Data type validation and conversion
Missing value handling

Data Cleaning

Column standardization (OHLCV format)
Numeric data cleaning (remove arrays/lists)
Timestamp conversion to datetime format
Duplicate removal with statistics

Data Balancing

Ticker distribution analysis
Automatic record balancing per ticker
Minimum record requirements
Data quality indicators

Format Conversion

Cross-format conversion (any input to any output)
Batch processing of multiple files
Schema preservation during conversion
Metadata handling

🚀 Performance Features

Memory Optimization

Virtual scrolling - Only loads visible data
Lazy loading - Loads data on demand
Intelligent caching - Caches frequently accessed data
Memory monitoring - Real-time RAM usage display
Automatic garbage collection

Large Dataset Handling

10M+ row support with virtual scrolling
Database-backed storage (DuckDB)
Efficient pagination for large datasets
Background processing to prevent UI freezing

Advanced Filtering

SQL-like query builder with visual interface
Multiple operators: equals, contains, greater_than, between, in, is_null, etc.
Complex conditions with AND/OR logic
Query saving/loading for reuse
Real-time filtering results

📊 Data Analysis Features

Statistical Analysis

Data distribution analysis
Ticker record counts
Date range coverage
Missing value statistics
Data quality metrics

File Analysis

Stooq format analysis with detailed reporting
Timestamp analysis for data continuity
Format detection and validation
File size and structure reporting

Keras Model Support

Model loading and validation
Model statistics display
Input/output shape analysis
Layer information extraction

🛠️ Technical Features

Multi-threading

Background processing for file operations
UI responsiveness during long operations
Thread-safe updates to GUI components
Progress tracking across threads

Error Handling

Enhanced error messages with suggestions
File validation before processing
Graceful failure handling
Error logging with detailed information

Configuration Management

INI file configuration (data_config.ini)
Database path configuration
Format-specific settings
User preferences storage

Logging and Monitoring

Comprehensive logging (redline.log)
Performance monitoring
Memory usage tracking
Operation statistics

📚 Documentation and Help

Built-in Help

Context-sensitive help for each tab
User manual with detailed instructions
Tooltips for buttons and controls
Error suggestions and troubleshooting

Manual Content

Data Loader manual - Step-by-step file processing
Data View manual - Navigation and analysis features
Troubleshooting guide - Common issues and solutions
Best practices for data processing

🔌 Integration Capabilities

Database Integration

DuckDB as primary storage engine
SQL query support for data retrieval
Table management and optimization
Connection pooling for performance

Machine Learning Integration

TensorFlow/Keras model support
Data preprocessing for ML pipelines
Format conversion for ML frameworks
Batch processing for training data

External Data Sources (Planned/Partially Implemented)

YFinance - Yahoo Finance data download
Tiingo - Financial data API integration
Enhanced Stooq - Improved Stooq format support

🎨 User Experience Features

Keyboard Shortcuts

Search focus (Ctrl+F)
Select all (Ctrl+A)
Copy selection (Ctrl+C)
Refresh data (F5)

Visual Feedback

Progress indicators for long operations
Status messages for user actions
Color-coded file status indicators
Responsive UI with loading states

Accessibility

High contrast text and backgrounds
Keyboard navigation support
Screen reader friendly interface
Adjustable window sizes

🔒 Data Security and Integrity

Data Validation

Input validation for all user inputs
File integrity checks
Data type verification
Schema compliance validation

Safe Operations

File backup before processing
Atomic operations for data safety
Error recovery mechanisms
Data preservation during conversion

🚀 Quick Start

Prerequisites

XQuartz: Required for GUI on macOS
- Download from: https://www.xquartz.org/
- Or check if installed: ls /Applications/Utilities/XQuartz.app
Docker: Make sure Docker Desktop is running

Running the GUI

Simple method (recommended):
```
./run_gui.bash
```
Test X11 forwarding first (if you encounter issues):
```
./test_x11.bash
```

Alternative method (if the simple method fails):

# Install socat first
brew install socat
# Then run
./run_gui_socat.bash

Command-Line Usage

You can run Redline in different modes using the --task argument:

gui — Launches the graphical user interface (default)
load — Loads data files into the DuckDB database
convert — Converts data files between supported formats
preprocess — Preprocesses data for machine learning or reinforcement learning

Examples:

python3 -m data_module --task=gui
python3 -m data_module --task=load
python3 -m data_module --task=convert
python3 -m data_module --task=preprocess

🔧 Installation

Dependencies

pip install pandas numpy duckdb pyarrow polars tensorflow tkinter

Optional Dependencies

pip install yfinance tiingo psutil

📖 Documentation

GUI_TROUBLESHOOTING.md - Troubleshooting guide for GUI issues
PERFORMANCE_IMPROVEMENTS.md - Performance optimization details
REDLINE_SOFTWARE_DESIGN.md - Software architecture and design

🤝 Contributing

REDLINE is designed with a modular architecture that makes it easy to extend:

Add new file format support
Implement new data sources
Enhance preprocessing capabilities
Improve performance features

📄 License

This project is designed for financial data processing and machine learning workflows.

This comprehensive feature set makes REDLINE a powerful tool for financial data processing, conversion, and analysis, suitable for both individual users and machine learning workflows.

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
redline2		redline2
.gitignore		.gitignore
Dockerfile		Dockerfile
FUTUREME.md		FUTUREME.md
GUI_SETUP_COMPLETE.md		GUI_SETUP_COMPLETE.md
GUI_TROUBLESHOOTING.md		GUI_TROUBLESHOOTING.md
PERFORMANCE_IMPROVEMENTS.md		PERFORMANCE_IMPROVEMENTS.md
README.md		README.md
REDLINE_SOFTWARE_DESIGN.md		REDLINE_SOFTWARE_DESIGN.md
build_arm.bash		build_arm.bash
build_x86.bash		build_x86.bash
data_config.ini		data_config.ini
data_module.py		data_module.py
data_module_grid.py		data_module_grid.py
data_module_shared.py		data_module_shared.py
data_user_manual.py		data_user_manual.py
load_to_ubuntu.bash		load_to_ubuntu.bash
main.py		main.py
redline_template.json		redline_template.json
run_arm.bash		run_arm.bash
run_gui.bash		run_gui.bash
run_gui_socat.bash		run_gui_socat.bash
run_x86.bash		run_x86.bash
save_image.bash		save_image.bash
save_x86_image.bash		save_x86_image.bash
simple_feather_test.py		simple_feather_test.py
ssd_REDLINE.txt		ssd_REDLINE.txt
test_enhanced_display.py		test_enhanced_display.py
test_export_and_stats.py		test_export_and_stats.py
test_feather_virtual_scrolling.py		test_feather_virtual_scrolling.py
test_keyboard_and_errors.py		test_keyboard_and_errors.py
test_nameerror_fix.py		test_nameerror_fix.py
test_performance.py		test_performance.py
test_performance_and_filtering.py		test_performance_and_filtering.py
test_race_conditions.py		test_race_conditions.py
test_scrollbar_fix.py		test_scrollbar_fix.py
test_selection_fix.py		test_selection_fix.py
test_selection_preservation.py		test_selection_preservation.py
test_x11.bash		test_x11.bash

keepdevops/redline

Folders and files

Latest commit

History

Repository files navigation

REDLINE - Financial Data Conversion & Management Tool

🎯 Core Purpose

📁 Supported File Formats

Input Formats

Output Formats

🖥️ GUI Interface Features

Main Application Window

Data Loader Tab

Data View Tab

🔧 Data Processing Capabilities

Data Validation

Data Cleaning

Data Balancing

Format Conversion

🚀 Performance Features

Memory Optimization

Large Dataset Handling

Advanced Filtering

📊 Data Analysis Features

Statistical Analysis

File Analysis

Keras Model Support

🛠️ Technical Features

Multi-threading

Error Handling

Configuration Management

Logging and Monitoring

📚 Documentation and Help

Built-in Help

Manual Content

🔌 Integration Capabilities

Database Integration

Machine Learning Integration

External Data Sources (Planned/Partially Implemented)

🎨 User Experience Features

Keyboard Shortcuts

Visual Feedback

Accessibility

🔒 Data Security and Integrity

Data Validation

Safe Operations

🚀 Quick Start

Prerequisites

Running the GUI

Command-Line Usage

🔧 Installation

Dependencies

Optional Dependencies

📖 Documentation

🤝 Contributing

📄 License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages